From 21da870bd0f6a9ec8a2ede60db72d0b63fa0daa7 Mon Sep 17 00:00:00 2001 From: tejasashinde Date: Thu, 16 Apr 2026 09:21:21 +0530 Subject: [PATCH] fix(i18n/hi): add boundary_chars and update action_pattern for Devanagari-aware matching --- mempalace/i18n/hi.json | 3 ++- 1 file changed, 2 insertions(+), 1 deletion(-) diff --git a/mempalace/i18n/hi.json b/mempalace/i18n/hi.json index f0e37c5..0333c2c 100644 --- a/mempalace/i18n/hi.json +++ b/mempalace/i18n/hi.json @@ -39,9 +39,10 @@ "topic_pattern": "[\\u0900-\\u097F]{2,}|[A-Za-z][A-Za-z0-9_]{2,}", "stop_words": "यह वह ये वे कुछ कई अधिकांश प्रत्येक हर अन्य केवल ऐसा बहुत होगा सकता चाहिए ज़रूर हाँ ठीक भी फिर अब पहले अभी वापस पूरा बनाना लेना देना जानना सोचना चाहना ज़रूरत जा आ आना जाना ढूँढना काम जोड़ा सहेजा सत्र सारांश वार्तालाप स्रोत विषय के एक बार बस वास्तव में कहाँ यहाँ वहाँ धन्यवाद कृपया सही गलत करें किया करता करती चलाएँ उपयोग", "quote_pattern": "\"([^\"]{20,200})\"", - "action_pattern": "(?:बनाया|सुधारा|लिखा|जोड़ा|भेजा|मापा|परीक्षण किया|समीक्षा की|निर्मित किया|हटाया|अद्यतन किया|विन्यस्त किया|तैनात किया|स्थानांतरित किया)\\s+[\\w\\s]{3,30}" + "action_pattern": "(?:बनाया|सुधारा|लिखा|जोड़ा|भेजा|मापा|परीक्षण किया|समीक्षा की|निर्मित किया|हटाया|अद्यतन किया|विन्यस्त किया|तैनात किया|स्थानांतरित किया)\\s+[\\w\\s\\u0900-\\u097F]{3,30}" }, "entity": { + "boundary_chars": "\\w\\u0900-\\u097F", "candidate_pattern": "[\\u0900-\\u097F]{2,20}", "multi_word_pattern": "[\\u0900-\\u097F]+(?:\\s+[\\u0900-\\u097F]+)+", "person_verb_patterns": [