From 33a98fb9d115ead95dee8de15133a40aa47f7e5d Mon Sep 17 00:00:00 2001 From: Tejas Shinde Date: Wed, 15 Apr 2026 23:33:24 +0530 Subject: [PATCH] Updated hi.json to support infra for entity,pronoun_patterns,dialogue_patterns,direct_address_pattern, project_verb_patterns and stopwords --- mempalace/i18n/hi.json | 64 ++++++++++++++++++++++++++++++++++++++++-- 1 file changed, 62 insertions(+), 2 deletions(-) diff --git a/mempalace/i18n/hi.json b/mempalace/i18n/hi.json index 38065e9..f0e37c5 100644 --- a/mempalace/i18n/hi.json +++ b/mempalace/i18n/hi.json @@ -39,6 +39,66 @@ "topic_pattern": "[\\u0900-\\u097F]{2,}|[A-Za-z][A-Za-z0-9_]{2,}", "stop_words": "यह वह ये वे कुछ कई अधिकांश प्रत्येक हर अन्य केवल ऐसा बहुत होगा सकता चाहिए ज़रूर हाँ ठीक भी फिर अब पहले अभी वापस पूरा बनाना लेना देना जानना सोचना चाहना ज़रूरत जा आ आना जाना ढूँढना काम जोड़ा सहेजा सत्र सारांश वार्तालाप स्रोत विषय के एक बार बस वास्तव में कहाँ यहाँ वहाँ धन्यवाद कृपया सही गलत करें किया करता करती चलाएँ उपयोग", "quote_pattern": "\"([^\"]{20,200})\"", - "action_pattern": "(?:built|fixed|wrote|added|pushed|measured|tested|reviewed|created|deleted|updated|configured|deployed|migrated)\\s+[\\w\\s]{3,30}" + "action_pattern": "(?:बनाया|सुधारा|लिखा|जोड़ा|भेजा|मापा|परीक्षण किया|समीक्षा की|निर्मित किया|हटाया|अद्यतन किया|विन्यस्त किया|तैनात किया|स्थानांतरित किया)\\s+[\\w\\s]{3,30}" + }, + "entity": { + "candidate_pattern": "[\\u0900-\\u097F]{2,20}", + "multi_word_pattern": "[\\u0900-\\u097F]+(?:\\s+[\\u0900-\\u097F]+)+", + "person_verb_patterns": [ + "\\b{name}\\s+ने\\s+कहा\\b", + "\\b{name}\\s+ने\\s+पूछा\\b", + "\\b{name}\\s+ने\\s+बोला\\b", + "\\b{name}\\s+ने\\s+बताया\\b", + "\\b{name}\\s+हँसा\\b", + "\\b{name}\\s+मुस्कुराया\\b", + "\\b{name}\\s+रोया\\b", + "\\b{name}\\s+सोचा\\b", + "\\b{name}\\s+चाहा\\b", + "\\b{name}\\s+पसंद\\s+किया\\b", + "\\b{name}\\s+नफरत\\s+की\\b", + "\\b{name}\\s+जानता\\s+है\\b" + ], + "pronoun_patterns": [ + "\\bवह\\b", + "\\bउसने\\b", + "\\bउसे\\b", + "\\bउसका\\b", + "\\bउन्होंने\\b", + "\\bउनका\\b", + "\\bवे\\b" + ], + "dialogue_patterns": [ + "^>\\s*{name}[:\\s]", + "^{name}:\\s", + "^\\[{name}\\]", + "\"{name}\\s+ने\\s+कहा" + ], + "direct_address_pattern": "\\bअरे\\s+{name}\\b|\\bनमस्ते\\s+{name}\\b|\\bधन्यवाद\\s+{name}\\b", + "project_verb_patterns": [ + "\\b{name}\\s+बना\\s+रहा\\s+है\\b", + "\\b{name}\\s+बनाया\\b", + "\\b{name}\\s+लॉन्च\\s+किया\\b", + "\\b{name}\\s+तैनात\\s+किया\\b", + "\\b{name}\\s+इंस्टॉल\\s+किया\\b" + ], + "stopwords": [ + "यह", "वह", "ये", "वे", + "मैं", "हम", "आप", "तुम", + "मेरा", "हमारा", "आपका", "उसका", "उनका", + "मुझे", "हमें", "आपको", "उसे", "उन्हें", + "का", "के", "की", + "को", "से", "में", "पर", + "के लिए", "के साथ", "के बारे में", "द्वारा", + "और", "या", "लेकिन", "क्योंकि", "तो", "यदि", + "भी", "ही", "सिर्फ", "केवल", + "है", "हैं", "था", "थे", "थी", + "हो", "होगा", "होता", "होती", + "कर", "करना", "किया", "करते", "करती", + "नहीं", "हाँ", "शायद", "ज़रूर", + "क्या", "कौन", "कब", "कहाँ", "क्यों", "कैसे", + "अब", "तब", "यहाँ", "वहाँ", + "बहुत", "कम", "अधिक", + "कुछ", "कोई", "सब", "हर" + ] } -} +} \ No newline at end of file