METODĂ PENTRU RESTAURAREA AUTOMATĂ A SEMNELOR DIACRITICE FOLOSIND TEXTE ACHIZIŢIONATE ELECTRONIC, UTILIZATĂ ÎN PROCESAREA LIMBAJULUI NATURAL

Price not visible for this package

Interest:

Assignment

Publication info:

No.: RO130875

Date: 29.01.2016

Inventor(s):

PETRICĂ LUCIAN [RO]

CUCU HORIA [RO]

BUZO ANDI [RO]

Applicant(s):
PETRICĂ LUCIAN [RO]
CUCU HORIA [RO]
BUZO ANDI [RO]
Classification:
International patent classification (IPC):
G06F17/21; G06F17/27

Cooperative patent classification (CPC):
Application info:
No.: RO20140000346
Date: 07.05.2014
Priority number(s):
RO20140000346 07.05.2014
Related patents:
RO130875
BOPI:
Description:

Invenţia se referă la o metodă de restaurare automată a semnelor diacritice într-un corpus de text format din fişiere multiple, pus la dispoziţie de către utilizator, destinată a fi utilizată în domeniul sistemelor de procesare a limbajului natural. Metoda conform invenţiei constă în împărţirea automată a corpusului de text în secţiuni de calitate înaltă, respectiv, scăzută, folosind un prag fix de frecvenţă de apariţie a semnelor diacritice, şi în utilizarea secţiunilor de calitate înaltă, pentru antrenarea unui model probabilistic de limbă, folosit pentru restaurarea semnelor diacritice în secţiunile de calitate scăzută.