Analisi testuale


#1

sto lavorando su un piccolo tool di analisi testuale.

ho visto che mi è molto utile l’inflector di rails per collassare
plurali/singolari/dashed/camelized a uno stesso significato. sapete se
viene
anche come package separato da rails?

sarebbe estremamente comodo anche avere una library con la capacità di
riconoscere (per eliminare) gli aggettivi, le congiunzioni, i pronomi,
etc…

conoscete qualcosa che serva allo scopo?


Chiaroscuro

Liquid Development: http://liquiddevelopment.blogspot.com/


#2

— chiaro scuro removed_email_address@domain.invalid ha scritto:

sto lavorando su un piccolo tool di analisi
testuale.

ho visto che mi è molto utile l’inflector di rails
per collassare
plurali/singolari/dashed/camelized a uno stesso
significato. sapete se viene
anche come package separato da rails?

dovrebbe essere nel pacchetto active_support, puoi
installare solo quello.
Alternativamente, come sempre, c’è un analogo in
facets: i metodi plural/pluralize e
singular/singularize.

Dashed non so cosa faccia, ma vedendolo associato a
camelized immagino siano equivalenti a
camelcase/camelize/humanize in facets.


icq: #69488917
blog ita: http://riffraff.blogsome.com

Chiacchiera con i tuoi amici in tempo reale!
http://it.yahoo.com/mail_it/foot/*http://it.messenger.yahoo.com


#3

Confermo quanto detto da Gabriele.
–Andrea


#4

Se lo vuoi fare per l’inglese c’e’ una implementazione del dello stemmer
di Porter come gem: http://stemmer.rubyforge.org/wiki/wiki.pl?HomePage

Potresti ricavare qualcosa anche dai sorgenti di Ferret (ma non so se e’
tutto ruby…)

ciao,
Luca

Un link veramente interessante!
Da approfondire sicuramente.

–Andrea R.


#5

chiaro scuro wrote:

sto lavorando su un piccolo tool di analisi testuale.

ho visto che mi è molto utile l’inflector di rails per collassare
plurali/singolari/dashed/camelized a uno stesso significato. sapete se
viene
anche come package separato da rails?

Se lo vuoi fare per l’inglese c’e’ una implementazione del dello stemmer
di Porter come gem: http://stemmer.rubyforge.org/wiki/wiki.pl?HomePage

Potresti ricavare qualcosa anche dai sorgenti di Ferret (ma non so se e’
tutto ruby…)

ciao,
Luca


luca.mearelli SU gmail.com


#6

Ottimo ragazzi! Grazie mille!!!

Per rimanere sul tema… qualche libreria che si colleghi a basi dati
esistenti per fornire sinonimi, opposti, etc… ? :slight_smile:

On 6/10/06, Andrea R. removed_email_address@domain.invalid wrote:


Chiaroscuro

Liquid Development: http://liquiddevelopment.blogspot.com/


#7

Per chi ne fosse interessato ho trovato anche questo link decisamente
attraente
http://www.tartarus.org/~martin/PorterStemmer/

Oltre a dare l’idea di che cosa tratti l’algoritmo, ne mostra
l’implementazione in diversi linguaggi tra i quali non poteva
sicuramente
mancare Ruby :slight_smile:

–Andrea R.


#8

Non so se possa centrare, forse no, ma probabilmente si potrebbe
effettuare
una ricerca sui dizionari che offre OpenOffice, anche se non ho la ben
che
minima idea di come possano essere costruiti.
In questo caso si potrebbe avere un supporto sia per l’inglese, ma anche
per
tutte le altre lingue, tra le quali l’italiano!

–Andrea R.


#9

chiaro scuro wrote:

sto lavorando su un piccolo tool di analisi testuale.

ho visto che mi è molto utile l’inflector di rails per collassare
plurali/singolari/dashed/camelized a uno stesso significato. sapete se
viene
anche come package separato da rails?

Se lo vuoi fare per l’inglese c’e’ una implementazione del dello stemmer
di Porter come gem: http://stemmer.rubyforge.org/wiki/wiki.pl?HomePage

Potresti ricavare qualcosa anche dai sorgenti di Ferret (ma non so se e’
tutto ruby…)

ciao,
Luca


#10

— chiaro scuro removed_email_address@domain.invalid ha scritto:

Ottimo ragazzi! Grazie mille!!!

Per rimanere sul tema… qualche libreria che si
colleghi a basi dati
esistenti per fornire sinonimi, opposti, etc… ? :slight_smile:

se frughi dentro rails c’è pure quello, serve a
consigliarti se usi un nome che è già usato dalla
libreria quando generi delle cose :slight_smile:

Cerca il metodo find_synonym che si collega a WordNet,
sono dieci righe.
Librerie più articolate non ne conosco, ma immagino si
possano fare velocemente.


icq: #69488917
blog it: http://riffraff.blogsome.com
blog en: http://www.riffraff.info

Chiacchiera con i tuoi amici in tempo reale!
http://it.yahoo.com/mail_it/foot/*http://it.messenger.yahoo.com


#11

yummy, sembra interessante.
sia questo che lo stemmer. vi farò sapere :slight_smile: