एआई एक ऐसा चलन है जिसके बारे में लाखों राय हैं – सकारात्मक और नकारात्मक, इसलिए, एक तकनीकी व्यक्ति के रूप में, मैंने इस पर कुछ व्यक्तिगत अनुभव प्राप्त करने का निर्णय लिया।
एआई को खोलना है या नहीं खोलना है
कुछ व्यक्तिगत अनुभव एकत्र करने के लिए – मैं AI पायथन कोड का परीक्षण कर रहा हूं जो निम्न के लिए ओपन सोर्स भाषा मॉडल का उपयोग करता है:
भाषण के पाठ
भाषण से पाठ
पाठ संकेत
मेरे पास एक ओपन एआई रैपर है।
लेकिन, इस पसंदीदा प्रोजेक्ट के लिए, मैं फीस कम करने और वास्तविक रूप से अपने हाथों को गंदा करने के लिए OpenAI API का उपयोग नहीं करना चाहता था। अन्यथा – मैं सिर्फ़ REST API इंटीग्रेटर होता और इससे कुछ भी नहीं सीख पाता।
पायथन साइड
हर चीज़ को सबसे छोटे बिल्डिंग ब्लॉक में विभाजित करने की ज़रूरत है – जिसे भौतिकी में पहला सिद्धांत भी कहा जाता है। कृत्रिम बुद्धिमत्ता के संदर्भ में यह है:
डेटा एकत्र करना जिसका उपयोग मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए किया जाएगा
वास्तविक दुनिया के डेटा को गणितीय मॉडल में बदलें जिसका उपयोग भविष्य की क्वेरीज़ के लिए किया जाएगा
मॉडलों को आरंभीकृत करें, मैपिंग करें और वांछित परिणाम प्राप्त करें।
उपरोक्त सभी में से मैंने केवल तीसरा चरण ही किया है, क्योंकि मैं चाहता था कि ऐप और अधिक तेजी से तैयार हो।
जावा/कोटलिन रैपर
मैं पायथन में कुशल नहीं हूँ, लेकिन मैं इतना बहुभाषी हूँ कि अपना काम पूरा कर सकता हूँ। मैंने ऊपर बताए गए कुछ फ्लास्क एंडपॉइंट बनाए हैं – ताकि मॉडल मेमोरी में रहें और तेज़ हों और उन्हें जावा वेब ऐप में लपेट दिया है।
अपने वांछित ऐप के एक भाग के रूप में, मैंने अपने पिछले प्रोजेक्ट को भी विस्तारित किया है। मैंने एक REST एंडपॉइंट खोला है जो Google अनुवाद API को कॉल करता है। इसमें कुछ जटिलताएँ थीं:
इसे कोटलिन में लागू किया गया था
GraaVM पर चल रहा है
क्वार्कस को आधार के रूप में प्रयोग करें
यह वैडिन वेब ऐप का हिस्सा है – https://programtom.com/dev/product/poc-translations-manager-application/
कुछ जगहों पर – मैंने क्वेरी कैशिंग लागू की है। कोई फर्क नहीं पड़ता कि कोई तीसरे पक्ष के एपीआई का उपयोग करता है या व्यक्तिगत – कैशिंग गति / उपयोग अनुभव में सुधार करेगा।
फ़्लटर ऐप
मेरे प्रोजेक्ट का अंतिम लक्ष्य एक फ़्लटर ऐप है जो
आवाज़ रिकॉर्ड करता है
इसे पाठ में लिपिबद्ध करता है
इसे अन्य भाषाओं में अनुवादित करता है
पाठ बोलता है
यह नई भाषाएँ सीखने या (किसी तरह धीरे-धीरे लेकिन – ) विदेशियों से उनकी भाषा में बात करने के लिए उपयोगी हो सकता है। ऐप उपयोग करता है:
फ़्लटर प्लगइन्स – iOS, Android और Windows के लिए
रिकॉर्डिंग
ऑडियो बजाना
sqlite3, flutter_bloc, flow_builder, आदि
मैंने विंडोज और iOS पर ऐप चलाया है, लेकिन मुझे एंड्रॉइड पर कुछ समस्याएं हैं। मुझे कई UX आइटम भी ठीक करने हैं, लेकिन मुझे उम्मीद है कि मैं इसे जल्द ही स्टोर पर प्रकाशित करने में कामयाब हो जाऊंगा।
टेकअवे
मैंने इस परियोजना पर बहुत प्रयोग किया है और बहुत कुछ सीखा है।
AI को बहुत ज़्यादा और आधुनिक कंप्यूटिंग शक्ति की ज़रूरत होती है। मेरे पास अपग्रेडेड RAM और SSD वाला पुराना PC है और फिर भी – यह मशीन लर्निंग एप्लीकेशन के लिए धीमा है
जबकि मैंने विभिन्न तकनीकी स्टैक और लाइब्रेरीज़ का प्रयोग करके बहुत कुछ सीखा है, मैं उस बिंदु को पार कर गया हूँ
यह सरल और बेवकूफ रखें
