สรุปเนื้อหา เรื่อง जनरेटिव AI for Thai Document OCR จากงานสัมมนา SCBX UNLOCKING AI (EP4)

สรุปเนื้อหา เรื่อง Generative AI for Thai Document OCR จากงานสัมมนา SCBX UNLOCKING AI (EP4)

मुख्य: थाई दस्तावेज़ OCR के लिए जनरेटिव AI

घटना: SCBX AI EP4 को अनलॉक करना, कंप्यूटर विज़न: AI चीजों को कैसे देखता है जैसे हम करते हैं

सहयोग: एससीबीएक्स और Insiderly.ai

कार्यक्रम-स्‍थल: एससीबीएक्स नेक्स्टटेक, सियाम पैरागॉन, चौथी मंजिल

वक्ता: डॉ. कोबकृत विरियायुथाकोर्न, अध्यक्ष, एआईईएटी और कंपनी के सीईओ। आईएपी प्रौद्योगिकी

कुछ लोग कागजी कार्रवाई करना पसंद करते हैं क्योंकि यह एक जटिल, जटिल कार्य है जो अपने आप में नए कौशल को मजबूत नहीं करता है, लेकिन बहुत से लोगों को यह जानकर प्रसन्नता होनी चाहिए कि जनरेटिव एआई का उपयोग कागजी कार्रवाई करता है जो उबाऊ हुआ करता था। इसके बजाय अन्य अधिक उपयोगी कार्यों पर जाने के लिए इसे थोड़े समय में पूरा किया जा सकता है।

डॉ. कोबकृत विरियायुथाकोर्न, अध्यक्ष, एआईईएटी, ने संगोष्ठी में थाई दस्तावेज़ ओसीआर के लिए जनरेटिव एआई के विषय के बारे में संक्षेप में बात की "एससीबीएक्स अनलॉकिंग एआई: ईपी 4 कंप्यूटर विजन: हाउ एआई सी थिंग्स लाइक वी डू" कि इस दस्तावेज़ तकनीक को ओसीआर कहा जाता है, जो ऑप्टिकल कैरेक्टर रिकग्निशन के लिए खड़ा है, जो डेटा को बदलने की प्रक्रिया है, चाहे वह चित्र हो या पाठ, एनालॉग प्रारूप में, डिजिटल जानकारी में जो व्यवस्थित तरीके से व्यवस्थित है।

डॉ. कोबकृत उन्होंने बताया कि थाईलैंड में, हम 2018 के बाद से लंबे समय तक दस्तावेज़ डेटा को अनपैक करने में मदद करने के लिए एआई का उपयोग करने में सक्षम हैं, विशेष रूप से आईडी कार्ड पर डेटा को ऑब्जेक्ट डिटेक्शन के माध्यम से अनपैक करके या डेटा के बड़े टुकड़ों को छोटे टुकड़ों में काटकर, और फिर व्यवस्थित करके डेटा को संरचित तरीके से यह जानने के लिए कि कौन से हिस्से कौन से हैं।

लेकिन भविष्य में, हमें अब ऑब्जेक्ट डिटेक्शन की आवश्यकता नहीं होगी क्योंकि हम कच्चे ओसीआर टेक्स्ट को निकालने के लिए जीपीटी जैसी इंटेलिजेंस का उपयोग कर सकते हैं और इसे स्वचालित रूप से संरचित डेटा में सॉर्ट कर सकते हैं।

ऑब्जेक्ट डिटेक्शन का उपयोग न करने का एक अतिरिक्त लाभ यह है कि हम उन दस्तावेज़ों का समर्थन कर सकते हैं जिनमें निश्चित टेम्पलेट नहीं हैं, जैसे कि विभिन्न स्वरूपों के साथ रसीदें, थाई दस्तावेज़ ओसीआर को लचीला बनाना और तुरंत नए दस्तावेज़ प्राप्त करने में सक्षम बनाना।

ओसीआर का लाभ यह है कि यह श्रमिकों को आधिकारिक पत्रों, उद्धरणों, रसीदों और चालानों जैसे दस्तावेजों में जानकारी का प्रबंधन करने में मदद करता है जिन्हें एक सुंदर संरचना में त्वरित और व्यवस्थित तरीके से व्यवस्थित किया जा सकता है। अंत तक एक-एक करके और एक-एक करके डेटा टाइप करने में समय बर्बाद करने की आवश्यकता नहीं है।

हालाँकि, एक नुकसान यह है कि वर्तमान GPT4 सिस्टम अभी भी डेटा को संसाधित करने में बहुत धीमा है। खासकर अगर डेटा थाई में दर्ज किया गया है। औसतन, इसे संसाधित करने में 60-90 सेकंड लगते हैं, जो सतह पर थोड़े समय की तरह लग सकता है, लेकिन अगर आपको 100 से अधिक शीट को संभालना है, तो इसका मतलब है कि इसके साथ लागत बढ़ जाएगी।

अच्छी खबर यह है कि थाईलैंड में, थाईलैंड का अपना जनरेटिव एआई जिसे ओपनथाईजीपीटी कहा जाता है, विकसित किया जा रहा है, जो एक एआई है जो थाई ज्ञान एकत्र करता है और इसका पैंटिप वेबसाइट से एक महत्वपूर्ण डेटाबेस है।

हाल ही में, विकास दल ने ग्रेड 6 स्तर पर ओनेट परीक्षा लेने और थाई बच्चों द्वारा किए जा सकने वाले औसत स्कोर से अधिक अंक प्राप्त करने का प्रयास किया। इतना ही नहीं, OpenThaiGpt अंग्रेजी में भी अच्छा है। थाई में न केवल अच्छा है।

फिर भी डॉ. कोबकृत बेशक, समग्र तस्वीर में, हमारा ओपन एआई ग्रामीण क्षेत्रों में एआई के साथ प्रतिस्पर्धा करने में सक्षम नहीं हो सकता है, लेकिन यह एक अच्छी दृष्टि है कि थाई लोगों को पहले से बेहतर काम करने में मदद करने के लिए यह एक महत्वपूर्ण कदम होगा, और इस साल के अंत तक, ओपनथाईजीपीटी संस्करण 70 बी भी जारी किया जाएगा, जो कई गुना स्मार्ट होगा।

शानदार! इसके बाद, द इनसाइडरली एआई तक पूर्ण पहुंच के लिए चेकआउट पूरा करें।
पुनः स्वागत है! आपने सफलतापूर्वक साइन इन कर लिया है.
आपने द इनसाइडरली एआई की सफलतापूर्वक सदस्यता ले ली है।
सफलता! आपका खाता पूरी तरह से सक्रिय है, अब आपके पास सभी सामग्री तक पहुंच है।
सफलता! आपकी बिलिंग जानकारी अपडेट कर दी गई है.
आपकी बिलिंग अद्यतन नहीं की गई थी.