Updated hi.json to support infra for entity,pronoun_patterns,dialogue_patterns,direct_address_pattern, project_verb_patterns and stopwords
This commit is contained in:
+61
-1
@@ -39,6 +39,66 @@
|
|||||||
"topic_pattern": "[\\u0900-\\u097F]{2,}|[A-Za-z][A-Za-z0-9_]{2,}",
|
"topic_pattern": "[\\u0900-\\u097F]{2,}|[A-Za-z][A-Za-z0-9_]{2,}",
|
||||||
"stop_words": "यह वह ये वे कुछ कई अधिकांश प्रत्येक हर अन्य केवल ऐसा बहुत होगा सकता चाहिए ज़रूर हाँ ठीक भी फिर अब पहले अभी वापस पूरा बनाना लेना देना जानना सोचना चाहना ज़रूरत जा आ आना जाना ढूँढना काम जोड़ा सहेजा सत्र सारांश वार्तालाप स्रोत विषय के एक बार बस वास्तव में कहाँ यहाँ वहाँ धन्यवाद कृपया सही गलत करें किया करता करती चलाएँ उपयोग",
|
"stop_words": "यह वह ये वे कुछ कई अधिकांश प्रत्येक हर अन्य केवल ऐसा बहुत होगा सकता चाहिए ज़रूर हाँ ठीक भी फिर अब पहले अभी वापस पूरा बनाना लेना देना जानना सोचना चाहना ज़रूरत जा आ आना जाना ढूँढना काम जोड़ा सहेजा सत्र सारांश वार्तालाप स्रोत विषय के एक बार बस वास्तव में कहाँ यहाँ वहाँ धन्यवाद कृपया सही गलत करें किया करता करती चलाएँ उपयोग",
|
||||||
"quote_pattern": "\"([^\"]{20,200})\"",
|
"quote_pattern": "\"([^\"]{20,200})\"",
|
||||||
"action_pattern": "(?:built|fixed|wrote|added|pushed|measured|tested|reviewed|created|deleted|updated|configured|deployed|migrated)\\s+[\\w\\s]{3,30}"
|
"action_pattern": "(?:बनाया|सुधारा|लिखा|जोड़ा|भेजा|मापा|परीक्षण किया|समीक्षा की|निर्मित किया|हटाया|अद्यतन किया|विन्यस्त किया|तैनात किया|स्थानांतरित किया)\\s+[\\w\\s]{3,30}"
|
||||||
|
},
|
||||||
|
"entity": {
|
||||||
|
"candidate_pattern": "[\\u0900-\\u097F]{2,20}",
|
||||||
|
"multi_word_pattern": "[\\u0900-\\u097F]+(?:\\s+[\\u0900-\\u097F]+)+",
|
||||||
|
"person_verb_patterns": [
|
||||||
|
"\\b{name}\\s+ने\\s+कहा\\b",
|
||||||
|
"\\b{name}\\s+ने\\s+पूछा\\b",
|
||||||
|
"\\b{name}\\s+ने\\s+बोला\\b",
|
||||||
|
"\\b{name}\\s+ने\\s+बताया\\b",
|
||||||
|
"\\b{name}\\s+हँसा\\b",
|
||||||
|
"\\b{name}\\s+मुस्कुराया\\b",
|
||||||
|
"\\b{name}\\s+रोया\\b",
|
||||||
|
"\\b{name}\\s+सोचा\\b",
|
||||||
|
"\\b{name}\\s+चाहा\\b",
|
||||||
|
"\\b{name}\\s+पसंद\\s+किया\\b",
|
||||||
|
"\\b{name}\\s+नफरत\\s+की\\b",
|
||||||
|
"\\b{name}\\s+जानता\\s+है\\b"
|
||||||
|
],
|
||||||
|
"pronoun_patterns": [
|
||||||
|
"\\bवह\\b",
|
||||||
|
"\\bउसने\\b",
|
||||||
|
"\\bउसे\\b",
|
||||||
|
"\\bउसका\\b",
|
||||||
|
"\\bउन्होंने\\b",
|
||||||
|
"\\bउनका\\b",
|
||||||
|
"\\bवे\\b"
|
||||||
|
],
|
||||||
|
"dialogue_patterns": [
|
||||||
|
"^>\\s*{name}[:\\s]",
|
||||||
|
"^{name}:\\s",
|
||||||
|
"^\\[{name}\\]",
|
||||||
|
"\"{name}\\s+ने\\s+कहा"
|
||||||
|
],
|
||||||
|
"direct_address_pattern": "\\bअरे\\s+{name}\\b|\\bनमस्ते\\s+{name}\\b|\\bधन्यवाद\\s+{name}\\b",
|
||||||
|
"project_verb_patterns": [
|
||||||
|
"\\b{name}\\s+बना\\s+रहा\\s+है\\b",
|
||||||
|
"\\b{name}\\s+बनाया\\b",
|
||||||
|
"\\b{name}\\s+लॉन्च\\s+किया\\b",
|
||||||
|
"\\b{name}\\s+तैनात\\s+किया\\b",
|
||||||
|
"\\b{name}\\s+इंस्टॉल\\s+किया\\b"
|
||||||
|
],
|
||||||
|
"stopwords": [
|
||||||
|
"यह", "वह", "ये", "वे",
|
||||||
|
"मैं", "हम", "आप", "तुम",
|
||||||
|
"मेरा", "हमारा", "आपका", "उसका", "उनका",
|
||||||
|
"मुझे", "हमें", "आपको", "उसे", "उन्हें",
|
||||||
|
"का", "के", "की",
|
||||||
|
"को", "से", "में", "पर",
|
||||||
|
"के लिए", "के साथ", "के बारे में", "द्वारा",
|
||||||
|
"और", "या", "लेकिन", "क्योंकि", "तो", "यदि",
|
||||||
|
"भी", "ही", "सिर्फ", "केवल",
|
||||||
|
"है", "हैं", "था", "थे", "थी",
|
||||||
|
"हो", "होगा", "होता", "होती",
|
||||||
|
"कर", "करना", "किया", "करते", "करती",
|
||||||
|
"नहीं", "हाँ", "शायद", "ज़रूर",
|
||||||
|
"क्या", "कौन", "कब", "कहाँ", "क्यों", "कैसे",
|
||||||
|
"अब", "तब", "यहाँ", "वहाँ",
|
||||||
|
"बहुत", "कम", "अधिक",
|
||||||
|
"कुछ", "कोई", "सब", "हर"
|
||||||
|
]
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
Reference in New Issue
Block a user