Latest index fixes for suffixes.

This commit is contained in:
Sergiotarxz 2023-09-05 17:28:57 +02:00
parent 505206e6e6
commit 147914c9ee

View File

@ -16,13 +16,14 @@ sub normalize($self, $text) {
return undef if !defined $text; return undef if !defined $text;
my $decomposed = NFKD( $text ); my $decomposed = NFKD( $text );
$decomposed =~ s/\p{NonspacingMark}//g; $decomposed =~ s/\p{NonspacingMark}//g;
$decomposed =~ s/(?: $decomposed =~ s/(?<=\w{4})(?:
ada|ado|aje|cion|diccion|duccion|dura|ección|epcion|ido|ion|miento| ada|ado|aje|cion|diccion|duccion|dura|eccion|epcion|ido|miento|
ncia|on|scripcion|sicion|sion|dad|tad|bilidad|edad|era|eria|ez|eza|ia|idad|ismo| ncia|scripcion|sicion|sion|dad|tad|bilidad|edad|era|eria|ez|eza|ia|idad|ismo|
ncia|ante|ente|ura|dor|dero|ero|ista|ado|ario|ia|ero|eria|able|aceo|aco|al|aneo| ncia|ante|ente|ura|dor|dero|ero|ista|ado|ario|ia|ero|eria|able|aceo|aco|al|aneo|
ante|ario|ente|rgir|ento|errimo|ible|ico|ífico|il|ino|ísimo|ivo|izo|oso|ear|ecer ante|ario|ente|rgir|ento|errimo|ible|ico|ifico|il|ino|isimo|ivo|izo|oso|ecer|
ificar|izar|es|as|os|e|o|a ificar|izar|es|as|os|e|o|a
)\b//xg; )\b//xg;
say STDERR $decomposed;
return $decomposed; return $decomposed;
} }