feat(i18n): add entity detection to Spanish locale
This commit is contained in:
@@ -40,5 +40,89 @@
|
|||||||
"stop_words": "el la los las un una unos unas de del al en con por para su sus mi mis tu tus es son está están fue ser estar haber sido como pero más muy también todo todos toda todas este esta estos estas ese esa esos esas que quien cual donde cuando porque aunque sin",
|
"stop_words": "el la los las un una unos unas de del al en con por para su sus mi mis tu tus es son está están fue ser estar haber sido como pero más muy también todo todos toda todas este esta estos estas ese esa esos esas que quien cual donde cuando porque aunque sin",
|
||||||
"quote_pattern": "\"([^\"]{10,200})\"|«([^»]{10,200})»",
|
"quote_pattern": "\"([^\"]{10,200})\"|«([^»]{10,200})»",
|
||||||
"action_pattern": "(?:construido|corregido|escrito|añadido|enviado|medido|probado|revisado|creado|eliminado|actualizado|configurado|desplegado|migrado)\\s+[\\wá-ú\\s]{3,30}"
|
"action_pattern": "(?:construido|corregido|escrito|añadido|enviado|medido|probado|revisado|creado|eliminado|actualizado|configurado|desplegado|migrado)\\s+[\\wá-ú\\s]{3,30}"
|
||||||
|
},
|
||||||
|
"entity": {
|
||||||
|
"candidate_pattern": "[A-ZÁÉÍÓÚÑÜ][a-záéíóúñü]{1,19}",
|
||||||
|
"multi_word_pattern": "[A-ZÁÉÍÓÚÑÜ][a-záéíóúñü]+(?:\\s+[A-ZÁÉÍÓÚÑÜ][a-záéíóúñü]+)+",
|
||||||
|
"person_verb_patterns": [
|
||||||
|
"\\b{name}\\s+dijo\\b",
|
||||||
|
"\\b{name}\\s+preguntó\\b",
|
||||||
|
"\\b{name}\\s+respondió\\b",
|
||||||
|
"\\b{name}\\s+contó\\b",
|
||||||
|
"\\b{name}\\s+rió\\b",
|
||||||
|
"\\b{name}\\s+sonrió\\b",
|
||||||
|
"\\b{name}\\s+lloró\\b",
|
||||||
|
"\\b{name}\\s+sintió\\b",
|
||||||
|
"\\b{name}\\s+piensa\\b",
|
||||||
|
"\\b{name}\\s+quiere\\b",
|
||||||
|
"\\b{name}\\s+ama\\b",
|
||||||
|
"\\b{name}\\s+odia\\b",
|
||||||
|
"\\b{name}\\s+sabe\\b",
|
||||||
|
"\\b{name}\\s+decidió\\b",
|
||||||
|
"\\b{name}\\s+escribió\\b"
|
||||||
|
],
|
||||||
|
"pronoun_patterns": [
|
||||||
|
"\\bél\\b",
|
||||||
|
"\\bella\\b",
|
||||||
|
"\\bellos\\b",
|
||||||
|
"\\bellas\\b",
|
||||||
|
"\\blo\\b",
|
||||||
|
"\\bla\\b",
|
||||||
|
"\\ble\\b",
|
||||||
|
"\\bles\\b",
|
||||||
|
"\\bse\\b"
|
||||||
|
],
|
||||||
|
"dialogue_patterns": [
|
||||||
|
"^>\\s*{name}[:\\s]",
|
||||||
|
"^{name}:\\s",
|
||||||
|
"^\\[{name}\\]",
|
||||||
|
"\"{name}\\s+dijo"
|
||||||
|
],
|
||||||
|
"direct_address_pattern": "\\bhola\\s+{name}\\b|\\bhey\\s+{name}\\b|\\bhi\\s+{name}\\b|\\bgracias\\s+{name}\\b|\\bquerido\\s+{name}\\b|\\bquerida\\s+{name}\\b|\\bestimado\\s+{name}\\b|\\bestimada\\s+{name}\\b|\\bdon\\s+{name}\\b|\\bdoña\\s+{name}\\b|\\bseñor\\s+{name}\\b|\\bseñora\\s+{name}\\b",
|
||||||
|
"project_verb_patterns": [
|
||||||
|
"\\bconstruyo\\s+{name}\\b",
|
||||||
|
"\\bconstruí\\s+{name}\\b",
|
||||||
|
"\\barmé\\s+{name}\\b",
|
||||||
|
"\\blancé\\s+{name}\\b",
|
||||||
|
"\\bdesplegué\\s+{name}\\b",
|
||||||
|
"\\binstalé\\s+{name}\\b",
|
||||||
|
"\\bla\\s+arquitectura\\s+{name}\\b",
|
||||||
|
"\\bel\\s+pipeline\\s+{name}\\b",
|
||||||
|
"\\bel\\s+sistema\\s+{name}\\b",
|
||||||
|
"\\bel\\s+proyecto\\s+{name}\\b",
|
||||||
|
"\\bel\\s+repositorio\\s+{name}\\b",
|
||||||
|
"\\b{name}\\s+v\\d+\\b",
|
||||||
|
"\\b{name}\\.py\\b",
|
||||||
|
"\\bimport\\s+{name}\\b",
|
||||||
|
"\\bpip\\s+install\\s+{name}\\b"
|
||||||
|
],
|
||||||
|
"stopwords": [
|
||||||
|
"el", "la", "los", "las", "un", "una", "unos", "unas",
|
||||||
|
"de", "del", "al", "a", "en", "con", "sin", "por", "para", "sobre",
|
||||||
|
"entre", "hasta", "desde", "hacia", "contra", "según", "tras",
|
||||||
|
"y", "o", "u", "ni", "pero", "sino", "aunque", "porque", "pues",
|
||||||
|
"que", "quien", "quienes", "cual", "cuales", "cuyo", "cuya",
|
||||||
|
"donde", "cuando", "como", "cuanto", "cuanta",
|
||||||
|
"yo", "tú", "él", "ella", "nosotros", "vosotros", "ellos", "ellas",
|
||||||
|
"me", "te", "se", "nos", "os", "lo", "la", "le", "los", "las", "les",
|
||||||
|
"mi", "mis", "tu", "tus", "su", "sus", "nuestro", "nuestra", "vuestro",
|
||||||
|
"este", "esta", "estos", "estas", "ese", "esa", "esos", "esas",
|
||||||
|
"aquel", "aquella", "aquellos", "aquellas", "esto", "eso", "aquello",
|
||||||
|
"ser", "estar", "haber", "tener", "hacer", "poder", "querer", "saber",
|
||||||
|
"es", "son", "fue", "fueron", "era", "eran", "está", "están", "estaba",
|
||||||
|
"he", "ha", "hemos", "han", "había", "hay",
|
||||||
|
"muy", "mucho", "mucha", "muchos", "muchas", "poco", "poca", "pocos", "pocas",
|
||||||
|
"más", "menos", "tan", "tanto", "también", "tampoco",
|
||||||
|
"sí", "no", "quizás", "tal", "vez",
|
||||||
|
"aquí", "allí", "allá", "ahí", "acá",
|
||||||
|
"hoy", "ayer", "mañana", "ahora", "antes", "después", "luego", "entonces",
|
||||||
|
"siempre", "nunca", "jamás", "todavía", "aún", "ya",
|
||||||
|
"bien", "mal", "mejor", "peor", "bueno", "buena", "malo", "mala",
|
||||||
|
"gracias", "hola", "adiós", "por favor", "perdón",
|
||||||
|
"día", "días", "semana", "mes", "año", "años", "tiempo", "vez", "veces",
|
||||||
|
"cosa", "cosas", "persona", "gente", "mundo", "vida", "casa", "lugar",
|
||||||
|
"forma", "manera", "parte", "caso", "punto", "idea", "hecho", "razón",
|
||||||
|
"nombre", "número", "versión", "sistema", "modelo"
|
||||||
|
]
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|||||||
Reference in New Issue
Block a user