sabato 2 gennaio 2010

Progetto di rimario online e sillabario (seri!) - Cercasi volontari...e programmatori.

Provo ad affidare a questa vetrina un'idea che ho da diverso tempo (sperando che chi voglia appropriarsene,quantomeno, mi contatti), e che sto cercando di tramutare in tesi di laurea (Nonostante i professori a cui ho proposto l'idea ritengano che sia inutile).

L'idea è quella di creare il primo rimario e sillabario (una sorta di dizionario che permetta di cercare le parole secondo criteri accentuativi/sillabici) completo, funzionale ed esaustivo Online.

Esistono altri progetti simili, ma essendo stati creati da non esperti in materia, risultano molto approssimativi.

Sono convinto che quest' idea non solo possa essere buona, ma possa avere un discreto riscontro di pubblico (considerando quante persone per diversi motivi scrivono o lavorano coi versi).

Purtroppo pero' le mie capacità di programmatore e scriptatore (principalmente si parla di perl/PHP) non sono adeguate a poter costruire il progetto partendo da zero.



IL RIMARIO
Data una parola (o una rima) fornisce le parole che con essa fanno rima perfetta ma:

  • - separa le rime rizoatone dalle rime rizotoniche (es: le rime grammaticali o "per suffisso" da quelle reali).
  • - mostra, dove possibile, una marca d'uso (es: poetico, comune, specialistico, basso uso).
  • -racchiude insieme, e permette di nascondere alla vista, tutte le rime formate unendo a un a radice uno stesso suffisso ( es: tra le rime in - ìa raggruppa insieme tutte le rime formate da una radice +logìa)
  • Mostra un numero di "frequenza d'uso" della parole (una parola/rima piu' frequente sarà meno "bella", ma piu' versatile.)

Il rimario dovrebbe inoltre permettere di raffinare la ricerca mostrando, a richiesta:
  • le assonanze forti (uoMo / buoNo)
  • Le rime "culturali" (siciliane, aretine, francesi come/lume)
  • Mostrare le rime foneticamente perfette (considerando due rime diverse: potére e sfère oppure /poZZo/ e /roZZo/ che tradizionalmente rimerebbero tra loro)
Butto lì altre proposte:
Sarebbe interessante poter includere anche le parole straniere, "normalizzandone" la fonetica secondo quella italiana (buone/Pantone).

Se fossero disponibili versioni digitalizzate dei "rimari" dei grandi poeti (Petrarca,Tasso, Ariosto, Alighieri...) si potrebbe, in caso la rima sia stata usata da qualcuno di questi, con un semplice click su di essa, mostrare in quale caso e da chi.


IL SILLABARIO
Il sillabario è una sorta di dizionario dei sinonimi, che permette di cercare le parole privilegiando l'aspetto sillabico/accentuativo su quello semantico.

Si tratterebbe di un semplice motore di ricerca,simile ad un normale dizionario per sinonimi, dove sia possibile specificare secondo un numero massimo/minimo di sillabe, l'accentazione

La ricerca delle parole è eseguita includendo nei risultati non solo dei sinonimi, ma anche: meronimi, iponimi, iperonimi, contrari e tutto cio' che puo', per vari motivi, "avere a che fare" con la parola data (Utilizzando strumenti di statistica del testo è infatti possibile identificare la forza di "attrazione" tra le parole).

Per semplificare le cose, si potrebbe mostrare in un riquadro a parte solo i sinonimi che rispettano i criteri dati (es:Mare sdrucciolo -> Oceano, Pelago); mentre tutti gli altri risultati che comunque rispettano i criteri sillabico/accentuativi dati, ma sono legate alla parola data da un altro tipo di legame semantico (Mare sdrucciolo -> Tùrbine iponimo), tutte insieme in un generico riquadro "vedi anche..." .

Nelle opzioni dovrebbe essere possibile specificare se la parola da cercare debba cominciare per vocale o meno ( parole che, tramite sineresi con la parola precedente, permettono di "risparmiare" una sillaba).

----------------------------------

Ho già iniziato a smanettare con un po' di codice e di base di dati, ma purtroppo le mie competenze informatiche (e la mole di lavoro che la cosa comporta) non mi permettono di metter sù l'intero progetto da solo.

Pubblico qui le (confuse) linee guida della mia idea, sperando di trovare qualche scriptatore/programmatore disposto a collaborare....


2 commenti:

malcom ha detto...

Anch'io, che sono un informatico, ho avuto la stessa idea, un vero rimario che non faccia rimare péso e obèso, ad esempio. Ma la base dati, l'archivo di tutti i lemmi accentati, e tutti i verbi coniugati ecc. ecc. dove lo troviamo? Ci fa un contratto Devoto-Oli e ci lascia usare la sua base dati e il suo coniugatore?
Malcom

BaRoNo ha detto...

Beh, proprio oggi ho avuto un incontro col direttore dell'istituto di Linguistica Computazionale del CNR a proposito di questo progetto, volevo vedere se riuscivo a farne una tesi.
Paradossalmente hanno un sacco di strumenti per insegnare ad una macchina a distinguere i "sensi£"d'una parola, ma non ne hanno che sappiano fargli contare le sillabe.

E' venuto fuori che praticamente il problema più grosso è trovare qualcuno che riesca a scrivere i codici dal punto di vista informatico.

L'archivio di tutti i lemmi accentati (con pronuncia segnata delle consonanti) e divisi in sillabe c'è...


C'è anche un coniugatore di verbi, che però andrebbe modificato perché riportasse l'accentazione (almeno per i verbi regolari)...


..e sono in possesso d'una lista dei suffissi (accentata) italiani...

il problema è che le mie capacità si fermano ad un po' di PHP e all'interrogazione della base di dati in sql... :-(