এআই প্রযুক্তির অন্দরে: বাংলা সাংবাদিকতায় এআই তৈরি চ্যালেঞ্জে ভরপুর, নেই যথেষ্ট সক্ষমতাও
এ মাসের ১৯ তারিখ ঢাকাভিত্তিক একটি বেসরকারি টেলিভিশন চ্যানেলের পর্দায় হঠাৎ করেই আবির্ভাব ঘটে এক সংবাদ উপস্থাপকের। শুরুতেই তাকে পরিচয় করিয়ে দেওয়া হয় বাংলাদেশের প্রথম আর্টিফিশিয়াল ইন্টেলিজেন্স বা কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির সাহায্যে তৈরি এআই উপস্থাপক হিসেবে। 'অপরাজিতা' নামক এই এআই সংবাদ উপস্থাপক দর্শকদের উদ্দেশে একটি সংবাদ পড়ে শোনান।
এর পরেই গণমাধ্যম ও সামাজিক যোগাযোগমাধ্যমে আলোচনার ঝড় বয়ে যায়। সংবাদ উপস্থাপকদের চাকরি কতটা ঝুঁকিতে পড়বে, গণমাধ্যম ছাড়াও অন্যান্য ক্ষেত্রে এআইয়ের প্রভাব কেমন হতে পারে ইত্যাদি নিয়ে দেখা যায় বিভিন্ন ধরনের মতামত। তবে এর পাশাপাশি আরেকটি বিষয় নিয়েও শুরু হয় আলোচনা — বাংলা ভাষায় অনর্গল কথা বলতে পারার মতো কোনো এআই অ্যাভাটার তৈরি করার প্রযুক্তি কি বাংলাদেশে রয়েছে? এই এআই উপস্থাপক তৈরির পেছনে কী কী প্রযুক্তি ব্যবহার করা হয়ে থাকতে পারে তা নিয়েও প্রশ্ন তোলেন অনেকে।
বাংলাদেশ ছাড়াও পৃথিবীর আরও বেশকিছু দেশের গণমাধ্যমে এআই উপস্থাপকের ব্যবহার শুরু হয়েছে, যার বেশিরভাগই হয়েছে ২০২৩ সালে এসে। কোন দেশে কী ধরনের প্রযুক্তি ব্যবহার করা হয়ে থাকতে পারে, সেটি জানার আগে জেনে নেওয়া দরকার একজন এআই সংবাদ উপস্থাপক তৈরি করতে কী কী প্রয়োজন।
এআই প্রযুক্তির অন্দরে
এআই প্রযুক্তির ভেতর-বাহির নিয়ে কথা বলেছেন ব্র্যাক বিশ্ববিদ্যালয়ের সহকারী অধ্যাপক ড. ফারিগ সাদেক। ইউনিভার্সিটি অভ অ্যারিজোনা থেকে পিএইচডি করা এই গবেষকের আগ্রহের বিষয়গুলোর মধ্যে রয়েছে কম্পিউটেশনাল লিঙ্গুইস্টিকস, অ্যাপ্লাইড ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এবং মেশিন লার্নিংয়ের মতো বিষয়।
একটি এআই এজেন্ট তৈরি করতে কী কী মূল বিষয় প্রয়োজন, সেটি ব্যাখ্যা করেছেন ড. সাদেক। এই এআই এজেন্ট হতে পারে টিভির পর্দার এআই অ্যাভাটার থেকে শুরু করে চ্যাটজিপিটির মতো জেনারেটিভ চ্যাটবট পর্যন্ত সবকিছু।
কৃত্রিম বুদ্ধিমত্তাসম্পন্ন কোনো প্রযুক্তি বানাতে প্রথমেই প্রয়োজন বিশাল পরিমাণ ডেটা। বিশেষ করে কোনো ভাষায় শ্রবণযোগ্য কথা বলতে সক্ষম হবে এমন কোনো এআই তৈরি করার জন্য সে ভাষায় রেকর্ড করা প্রচুর অডিও প্রয়োজন। কথাগুলো হতে পারে বিভিন্ন আঞ্চলিক টানে অথবা ভঙ্গিতে। একইসঙ্গে আশপাশে বিভিন্ন নয়েজও থাকা জরুরি, যাতে করে নয়েজযুক্ত কথাও শনাক্ত করা যায়। আনুমানিক ১০ হাজার ঘণ্টার মতো অডিও রেকর্ড থাকা প্রয়োজন। তবে এর চেয়ে কম-বেশিও হতে পারে।
ডেটাসেট থাকার পাশাপাশি প্রয়োজন একটি জটিল এআই মডেল। সাম্প্রতিক সময়ে এআই-এর উত্থানের পেছনে রয়েছে গত ৫–৬ বছরে আবিষ্কৃত হওয়া ট্রান্সফর্মার মডেল। এই মডেলের মাধ্যমে এমন এআই প্রযুক্তি তৈরি করা সম্ভব হচ্ছে, যা এর আগে করা সম্ভব ছিল না। পর্যাপ্ত ডেটার যোগান থাকলে মডেলটি নিজে নিজেই অনেক কিছু শিখে নিতে পারে।
তবে এ পর্যায়ের মূল চ্যালেঞ্জ হলো মডেলগুলো ডিজাইন এবং প্রসেস করার মতো হাই-পারফরম্যান্স কম্পিউটার। ডিজাইনকৃত কিংবা ইতোমধ্যেই তৈরি করা এআই পণ্যগুলোকে হয়তো সাধারণ কম্পিউটারের মাধ্যমে ব্যবহার করা সম্ভব। তবে চ্যাটজিপিটির মতো শক্তিশালী এআই মডেল ডিজাইন করার মতো উঁচু-ক্ষমতাসম্পন্ন কম্পিউটার বাংলাদেশে বেশ বিরল। এবং এ ধরনের প্রযুক্তি হাতে পেতে হলেও প্রয়োজন মোটা অঙ্কের বিনিয়োগ।
মডেল ও ডেটাসেটের পাশপাশি আরও একটি জিনিস দরকার — দক্ষতাসম্পন্ন মেশিন লার্নিং ইঞ্জিনিয়ার। মডেলকে গোড়া থেকে তৈরি করা ও সেটির মাধ্যমে ডেটা বিশ্লেষণ করে একটি এআই প্রোডাক্টকে ব্যবহারযোগ্য করে তোলার মতো দক্ষ ও প্রশিক্ষিত ব্যক্তিও বাংলাদেশে খুব বেশি নেই।
চ্যাটজিপিটির মতো জেনারেটিভ এআই তৈরি করা ভার্চুয়াল এআই অ্যাভাটারের চেয়ে তুলনামূলক কঠিন। কারণ ভার্চুয়াল এআই অ্যাভাটারের ক্ষেত্রে কাজ হলো কেবল টেক্সটকে শ্রবণযোগ্য শব্দে রূপান্তর করা, যেখানে এআই প্রোগ্রামটি লিখিত শব্দকে পড়ে স্পিচ সিন্থেসাইজ প্রক্রিয়ার মাধ্যমে অডিওতে রূপান্তর করে। এখানে ডেটাসেটে থাকা বিশাল পরিমাণ রেকর্ড করা অডিওর ভেতর থেকে কোনো অক্ষর বা শব্দ কোন ধ্বনির মাধ্যমে উচ্চারণ করা হয়েছে, তা বিশ্লেষণ করা হয়।
এআই অ্যাভাটারের ক্ষেত্রে অডিওর সঙ্গে যোগ করা হয় একটি মুখাবয়ব। সংবাদ উপস্থাপকদের সংবাদ পাঠের ক্ষেত্রে খুব বেশি মুখভঙ্গি প্রকাশের প্রয়োজন পড়ে না। রাগ, দুঃখ বা হাসির মতো ভঙ্গিগুলোর অনুপস্থিতির কারণে একটি এআই অ্যাভাটারের খুব বেশি ভিডিও ইনপুটও প্রয়োজন হয় না। ফলে অডিওর মতো একইভাবে, ভিডিও ডেটাকে বিশ্লেষণ করে দেখা হয় কোনো ধ্বনি উচ্চারণের সময় ঠোঁটের আকার-অবস্থান, মুখের পেশিগুলোর পরিবর্তন কীভাবে হচ্ছে। যত বেশি ডেটা বিশ্লেষিত হবে, পর্দার এআই অ্যাভাটারের মুখভঙ্গি তত বেশি সাবলীল ও স্বাভাবিক মনে হবে।
অন্যদিকে, জেনারেটিভ এআই চ্যাটবট তৈরির ক্ষেত্রে টেক্সটকে অডিওতে রূপান্তর করতে হয় না। তবে এর কাজ আরও জটিল। ন্যাচারাল ল্যাঙ্গুয়েজ বা মানুষের ব্যবহার করা স্বাভাবিক লেখ্যভাষা বোঝা এবং সেটিকে প্রসেস করে প্রশ্নোত্তর পুনরায় ন্যাচারাল ল্যাঙ্গুয়েজে গুছিয়ে তুলে ধরা এআই অ্যাভাটারের তুলনায় বেশ কঠিন।
এক্ষেত্রেও মূল চ্যালেঞ্জ ডেটার পর্যাপ্ততা এবং হাই-পারফরম্যান্স কম্পিউটার। এআই মডেলের কোর আর্কিটেকচার একইরকম হওয়ায়, সেগুলো যেকোনো ভাষার ক্ষেত্রেই একইভাবে কাজ করতে সক্ষম হবে। তবে ইংরেজি ভাষায় চ্যাটজিপিটি তৈরি করা সম্ভব হলেও বাংলা ভাষায় এখনো এরকম চ্যাটবট তৈরি করা সম্ভব হয়নি মূলত উপর্যুক্ত দুটি কারণেই।
তবে এআই প্রযুক্তির চাকা খুব দ্রুত ঘুরছে। এতটাই দ্রুত যে গবেষক ও বিজ্ঞানীরাও এর গতিপথ বুঝে উঠতে হিমশিম খাচ্ছেন। পাঁচ বছর আগে যা কল্পনা করা যেত না, তা এখন সাধারণ মানুষের কাছেও অত্যন্ত স্বাভাবিক বলে মনে হচ্ছে। ফলে কয়েক বছর পর এআই ঠিক কোন পর্যায়ে পৌঁছাবে তা অনুমান করা দুঃসাধ্য, বিশেষ করে যখন মডেলগুলো ডেটা বিশ্লেষণ করে নিজে নিজেই শিখে নিতে সক্ষম।
সফটওয়্যার অ্যাজ আ সার্ভিস (স্যাস) এবং এআই অ্যাভাটারের উত্থান
সংবাদ উপস্থাপক হিসেবে এআইয়ের শুরুটা হয়েছিল ২০১৮ সালে, চীনের শিনহুয়া এজেন্সির মাধ্যমে। দ্য গার্ডিয়ান-এর তথ্যানুযায়ী, শিনহুয়া এজেন্সির উপস্থাপক কিউ হাওয়ের চেহারা, মুখভঙ্গি ও কণ্ঠস্বরের ডেটাকে প্রসেস করে মেশিন লার্নিংয়ের মাধ্যমে তারই হুবহু আদলে এআই উপস্থাপকটিকে তৈরি করা হয়েছিল।
২০২১ সালের মধ্যে একই কায়দায় চীন ও দক্ষিণ কোরিয়ার চারটি নিউজরুমে আবির্ভাব ঘটে আরও কিছু এআই উপস্থাপকের। আর এর সবগুলোর সঙ্গেই জড়িত ছিল দক্ষিণ কোরিয়াভিত্তিক কোম্পানি ডিপব্রেইন এআই।
ডিপব্রেইন এআইয়ের বিজনেস ডেভেলপমেন্ট ম্যানেজার জো মারফির এক সাক্ষাৎকার থেকে এই এআই উপস্থাপক বানানোর পুরো প্রক্রিয়াটিই উঠে আসে। জানা যায়, আসল উপস্থাপককে ক্যামেরা সামনে বসিয়ে একটি ৫০০ থেকে ১০০০ বাক্যের বিশেষ স্ক্রিপ্ট পড়ানো হয়, যেখানে সে ভাষার প্রায় সব ধরনের ধ্বনির উপস্থিতি থাকে। কোনো ধ্বনি উচ্চারণের সময়, কোনো শব্দ পড়ার সময় মুখভঙ্গি কেমনভাবে বদলে যাচ্ছে, কোন জায়গায় উপস্থাপক থামছে বা বিরতি নিচ্ছে তা ভিডিওতে ধারণ করা হয়। এরপর এই ডেটাকে কাজে লাগিয়েই তৈরি করা হয় একটি এআই ভিডিও অ্যাভাটার, যেগুলো সেই উপস্থাপকের মতোই যেকোন শব্দ উচ্চারণ করতে সক্ষম। মারফি জানান, এভাবে একটি আসলে উপস্থাপকের এআই অ্যাভাটার বানাতে প্রায় ৩ সপ্তাহ সময়ের দরকার হয়।
এর মাঝখানে ২০১৯ সালে পূর্ব ইউরোপের দেশ লাটভিয়াতে দেশটির বৃহত্তম ডিজিটাল মিডিয়া কোম্পানি ডেলফি এবং ইউরোপের অন্যতম প্রভাবশালী ভাষাগত প্রযুক্তি কোম্পানি টিল্ডা একত্রিত হয়ে ইউরোপের প্রথম এআই উপস্থাপক লরাকে উন্মোচন করে। মেশিন লার্নিং প্রযুক্তি ব্যবহার করেই লাটভিয়ার এক জনপ্রিয় উপস্থাপককে অনুকরণ করে তৈরি লরার চেহারা অবশ্য একটু কার্টুনের মতো।
তবে এআই উপস্থাপক ব্যবহারের হিড়িক পড়ে যায় ২০২৩ সালে এসে। মালয়েশিয়া, ইন্দোনেশিয়া, তাইওয়ান, গ্রিস, কুয়েত থেকে শুরু করে ভারতের টিভি পর্দাতেও হাজির হয় এআই উপস্থাপক। তবে লক্ষ্যণীয় বিষয় হলো, এই এআই উপস্থাপকদের সঙ্গে বিভিন্ন সফটওয়্যার অ্যাজ আ সার্ভিস (স্যাস) সরবরাহ করা কোম্পানির অ্যাভাটারগুলোর আশ্চর্যজনকভাবে মিল রয়েছে।
যেমন, ভারতের সরকারি পোর্টাল ইন্ডিয়াএআই ডটগভ ডটইন-এর একটি সংবাদের সূত্র ধরে দেখা যায়, দক্ষিণ ভারতের কন্নড় ভাষার টিভি চ্যানেল পাওয়ার টিভিতে 'সৌন্দর্য' নামক যে এআই উপস্থাপককে তুলে ধরা হয়েছে, তার সঙ্গে ডিপব্রেইনএআই কোম্পানির 'এআই হায়লিন' অ্যাভাটারের হুবহু মিল রয়েছে।
অন্যদিকে, মালয়েশিয়ার অ্যাস্ট্রো আওয়ানি চ্যানেলে প্রচারিত সংবাদপাঠক 'জুন'-এর সঙ্গে 'এইআই স্পোকসপার্সন ভিডিও ক্রিয়েটর' সার্ভিস দেওয়া কোম্পানি হেইজেন-এর ওয়েবসাইটের তালিকায় থাকা 'জুন' অ্যাভাটারের হুবহু মিল পাওয়া যায়। এমনকি নামটিও পরিবর্তন করা হয়নি।
ফলে স্বাভাবিকভাবেই প্রশ্ন চলে আসে, সারাবিশ্বে যে হঠাৎ করে এআই উপস্থাপকের হিড়িক পড়ে গেল, এর কতটুকু স্যাস প্রদান করা কোম্পানিগুলোর অবদান, আর কতটুকু চ্যানেলগুলোর নিজস্ব এআই গবেষণার ফসল?
ড. সাদেক এ প্রসঙ্গে মন্তব্য করতে গিয়ে বলেন, 'আমার মনে হয় না এখনো পর্যন্ত কোনো গণমাধ্যমের এমন প্রযুক্তিগত সক্ষমতা তৈরি হয়েছে যেখানে তারা নিজেরাই একেবারে গোড়া থেকে একটি সম্পূর্ণ এআই উপস্থাপক তৈরি করতে পারবে, যারা সম্পূর্ণ নতুন একটি ভাষায় সাবলীলভাবে স্বাভাবিক অঙ্গভঙ্গির মাধ্যমে সংবাদ উপস্থাপনা করতে পারবে।
'এ ধরনের ক্ষমতা কেবল বড় বড় টেক জায়ান্টদের হাতেই রয়েছে, যারা এর পেছনে বিলিয়ন বিলিয়ন ডলার বিনিয়োগ করেছে। মাইক্রোসফটের সঙ্গে সংযুক্ত থাকা ওপেনএআই-এর কথাই ধরা যাক। জিপিটি ৩.৫ উন্মুক্ত হলেও এর আরও উন্নত সংস্করণ জিপিটি ৪ কিন্তু সবার জন্য উন্মুক্ত নয়। কারণ এই মডেলগুলো বেশ ব্যয়বহুল।'
তবে টিভি চ্যানেলগুলো যদি অন্য কোম্পানির সার্ভিস কিনেও থাকে, তবে কি এর পেছনে বিন্দুমাত্র এআই নেই? তা অবশ্য আছে।
'এক্ষেত্রে স্যাস প্রদান করা কোম্পানিগুলো মূলত মডেল আর প্রযুক্তিগত সহায়তাটুকু দিয়ে থাকে। ডেটার অংশটি আসে গণমাধ্যমের কাছ থেকে। প্রতিটি চ্যানেলেই কয়েক শত ঘণ্টার উপস্থাপনার রেকর্ডিং থাকে। তাদের কাছ থেকে পাওয়া ডেটা মেশিন লার্নিংয়ের মাধ্যমে প্রসেস করে স্যাস প্রদান করা কোম্পানিগুলোর পক্ষে ইংরেজি ব্যতীত অন্য ভাষায় একটি এআই উপস্থাপক তৈরি করে ফেলা কঠিন কিছু নয়। টেক্সট ইনপুট দিয়েই সেই টেক্সট অনুযায়ী এআই উপস্থাপককে কথা বলানো সম্ভব,' বলেন ড. সাদেক।
তবে যেহেতু এখানে প্রসেসকৃত ডেটার পরিমাণ কম, নতুন ভাষার কিছু ভাষাগত জটিলতা রয়েছে, তাই মুখভঙ্গিতে অস্বাভাবিকতা, খুবই ধীরগতিতে কথা বলা কিংবা কথার মধ্যে জড়তা কিছুটা হলেও থেকে যাবে। একে আরও স্বাভাবিক করার জন্য প্রয়োজন আরও প্রসেসিং।
একটি পূর্ণাঙ্গ এআই-চালিত নিউজরুম কেমন হতে পারে?
ভবিষ্যৎ জেনে নেওয়ার আগে জেনে নেওয়া যাক এই বর্তমান সময়েই নিউজরুমে কী কী ক্ষেত্রে এআই ব্যবহার করা হচ্ছে।
গত মে মাসে প্রকাশিত ওয়ার্ল্ড অ্যাসোসিয়েশন অভ নিউজ পাবলিশার্স-এর করা এক জরিপ অনুযায়ী, বিশ্বজুড়ে অর্ধেকের বেশি নিউজরুমে চ্যাটজিপিটির মতো জেনারেটিভ এআই টুল ব্যবহার করা হয়। গত বছরের নভেম্বর মাসের শেষ দিনে বের হওয়া প্রযুক্তিটিকে ছয় মাসের মধ্যেই যেভাবে সবাই নিজেদের প্রয়োজন মেটাতে ব্যবহার করছে, এর সুবিধা নেওয়ার জন্য বাকি নিউজরুমগুলোও খুব বেশি দেরি করবে না।
জরিপের ফলাফল অনুযায়ী, জেনারেটিভ এআই সবচেয়ে বেশি ব্যবহৃত হয় লম্বা প্রতিবেদনকে সংক্ষিপ্ত করা, বা বুলেট পয়েন্ট করার জন্য। এর ঠিক পরেই রয়েছে কীভাবে কোনো বিষয় সম্পর্কে গবেষণা কীভাবে করতে হবে তার গাইডলাইন পাওয়ার জন্য। এছাড়াও লেখার বানান ও ব্যকরণ ঠিক করা, সম্পূর্ণ আর্টিকেল লিখে দেওয়া, টপিকের আইডিয়া খোঁজা, এমনকি অনুবাদের জন্যেও চ্যাটজিপিটির মতো টুল ব্যবহার করা হয়।
কিন্তু এগুলোর সবই জেনারেটিভ এআইয়ের ব্যবহার। যে সকল চ্যানেল তাদের সংবাদ পড়ার জন্য নিয়মিতভাবে ভার্চুয়াল অ্যাভাটারকে ব্যবহার করছে, তাদের ক্ষেত্রে কীভাবে এআই ব্যবহৃত হচ্ছে?
ডিপব্রেইন এআই-এর জো মারফি জানান, এআই অ্যাভাটারগুলোকে মূলত ব্যবহার করা হয়, সারাদিন ধরে থাকা ছোট ছোট নিউজ সেগমেন্টের জন্য, যখন উপস্থাপক কোনো ফিল্ড রিপোর্টের জন্য বাইরে আছেন বা অন্য কোনো গুরুত্বপূর্ণ নিউজ স্টোরির জন্য কাজ করছেন। ফলে প্রতি ঘণ্টায় উপস্থাপককে ব্রেকিং নিউজ বা বুলেটিন দেওয়ার জন্য ক্যামেরার সামনে উপস্থিত হতে হচ্ছে না। তাদের ভার্চুয়াল এআই দিয়েই কাজ চালিয়ে নেওয়া যাচ্ছে।
তাহলে ভবিষ্যতে কীভাবে এআইকে সম্পূর্ণরূপে নিউজরুমে ব্যবহার করা হতে পারে? আল জাজিরা মিডিয়া ইনিস্টিউট-এর সাংবাদিক কন্সটানটিনোস আন্টোনোপৌলোস এক্ষেত্রে বেশ কিছু ভবিষ্যদ্বাণী করেছেন, এই কাজগুলো কীভাবে এআইয়ের মাধ্যমে করা যেতে পারে এবং এটি কীভাবে সাংবাদিকদেরই সাহায্য করবে সে সম্পর্কেও ধারণা দিয়েছেন।
প্রথমত, এআই-এর মাধ্যমে রিয়েল-টাইম ট্রান্সক্রিপশন করা সম্ভব হবে। অডিও থেকে টেক্সটে রূপান্তরের কাজ এআই দিয়েই করিয়ে নেওয়া যাবে। ফলে ঘণ্টার পর ঘণ্টা বসে ম্যানুয়্যালি ট্রান্সক্রিপ্ট করার প্রয়োজন হবে না। দ্বিতীয়ত, অনুবাদের কাজও এআই সহজে করতে পারবে, ফলে একই কন্টেন্ট বিভিন্ন ভাষায় সরবরাহ করা আরও দ্রুত ও সহজ হবে।
তৃতীয়ত, কঠিন ভাষায় লেখা প্রতিবেদনকে আরও বোধগম্য ও সহজ ভাষায় পুনর্লিখন করতে সক্ষম হবে এআই। চতুর্থত, ভালো শিরোনাম খুঁজে বের করা আর সংবাদের মূলভাব বের করা আরও সহজ হবে। পঞ্চমত, এআই নিজেই বিভিন্ন ডেটাবেজের সঙ্গে সংযুক্ত থাকবে, যেটি ব্যবহার করে তারা কোনো সংবাদের সত্যতা যাচাই করতে পারবে। ফলে ম্যানুয়ালি ফ্যাক্ট-চেক করার প্রয়োজন পড়বে না।
ষষ্ঠত, অডিয়েন্সের কন্টেন্ট পড়ার ধরন বিশ্লেষণ করে এআই নিজেই পাঠকের সামনে তার পছন্দানুযায়ী কন্টেন্ট সরবরাহ করতে পারবে। সপ্তমত, কোনো কন্টেন্ট পড়ার পর পাঠকদের অনুভূতি কেমন, সে সম্পর্কে তাদের মতামত কেমন, এবং সর্বোপরি কোনো বিষয় সম্পর্কে জনমত ইতিবাচক নাকি নেতিবাচক তা যাচাই করতে পারবে এআই।
মনে হতে পারে, এর অনেকগুলোই তো ইতোমধ্যেই নিউজরুমে ব্যবহার করা হচ্ছে। চ্যাটজিপিটিতে প্রম্পট দিয়েই যেকোনো প্রতিবেদকই এগুলো করে ফেলতে পারেন। তবে পূর্ণাঙ্গ এআই নিউজরুমের ক্ষেত্রে সবকিছুই হবে স্বয়ংক্রিয়ভাবে।
অর্থাৎ, এআই নিজেই পাঠকের কাছ থেকে পাওয়া ডেটা বিশ্লেষণ করে সিদ্ধান্ত নেবে কোন সংবাদ প্রস্তুত করা হবে, কীভাবে করা হবে, কোন কোন ভাষায় সরবরাহ করা হবে, কীভাবে শিরোনাম এবং সূচনা লেখা হলে পাঠক আরও বেশি কন্টেন্টের প্রতি আকর্ষিত হবে ইত্যাদি। তাহলে মানুষ সাংবাদিকদের কী হবে? এখানেই চলে আসে এআই ব্যবহারের ঝুঁকির প্রশ্ন।
এআই ব্যবহারের ঝুঁকি
ওয়ার্ল্ড অ্যাসোসিয়েশন অভ নিউজ পাবলিশার্স-এর জরিপ থেকে জেনারেটিভ এআই ব্যবহারের ঝুঁকি সম্পর্কেও প্রশ্ন করা হয়। জরিপে অংশগ্রহণকারী সাংবাদিকদের মাত্র ৩৮ শতাংশ মনে করেন, এআই তাদের চাকরির নিরাপত্তার জন্য হুমকিস্বরূপ। চাকরি খোয়ানোর চেয়ে ভুল তথ্য (৮৫ শতাংশ), প্লেজিয়ারিজম বা কপিরাইট ভঙ্গ (৬৭ শতাংশ) আর ডেটার সুরক্ষাকেই (৪৬ শতাংশ) আরও বড় হুমকি বলে মনে করেন তারা।
এআইয়ের কাছে চাকরি খোয়ানোর হুমকি অবশ্য একেবারে অমূলক নয়। তাই একটি এআই কত ভালো প্রতিবেদক হতে পারবে, সেটি নিয়েই পরীক্ষা-নিরীক্ষা করেন স্কাইনিউজ-এর বিজ্ঞান ও প্রযুক্তি বিভাগের সম্পাদক টম ক্লার্ক। বর্তমান এআই প্রযুক্তির মাধ্যমে কত ভালো প্রতিবেদন তৈরি করা সম্ভব তা নিয়ে করা প্রতিবেদনটি প্রকাশিত হয় এ মাসের ৬ তারিখে।
পুরো প্রক্রিয়াতেই বিভিন্নভাবে নানা ধরনের এআই টুলকে ব্যবহার করা হয়েছে। এখানে পাইথন প্রোগ্রামিং করে এমন ব্যবস্থা তৈরি করা হয়, যেখানে চ্যাটজিপিটি দুটো আলাদা এআই সত্ত্বা হিসেবে কাজ করবে। একটি এআই প্রতিবেদক, অন্যটি এআই সম্পাদক। সম্পাদক ও প্রতিবেদক একে অপরের সঙ্গে আলোচনা করে কয়েকটি স্টোরির সমন্বয়ে একটি টিভি নিউজ শোয়ের স্ক্রিপ্ট তৈরি করবে।
টিভি উপস্থাপকের জন্য স্কাইনিউজ-এর একজনকে কর্মীকে নির্বাচন করা হয়। ক্যামেরার সামনে মাত্র চার মিনিটের স্ক্রিপ্ট পড়িয়েই হেইজেন-এর সাহায্যে একই কণ্ঠস্বর ও একই চেহারার একটি ভার্চুয়াল এআই তৈরি করে ফেলা হয়।
এআইয়ের সম্পুর্ণ কাজ শেষ হওয়ার পর যে প্রতিবেদনটি বের হয়ে আসে, তা থেকে দেখা যায় 'এআই প্রতিবেদক' তার কাজ বেশ ভালভাবেই করেছে। এর বেশিরভাগ স্টোরি আইডিয়াই যৌক্তিক ও তথ্যনির্ভর ছিল। একইসাথে টিভি স্ক্রিপ্ট এবং এর সাথে কী ফুটেজ থাকতে পারে, তার পরামর্শও ছিল চমৎকার। বিভিন্ন বিশেষজ্ঞদের সঙ্গে কীভাবে যোগাযোগ করতে হবে, কীভাবে ইমেইল লিখতে হবে, তাও জানিয়ে দিয়েছে এআই প্রতিবেদক।
তবে এআই একটি সংবাদের ক্ষেত্রে ভুল তথ্য দেয়, এবং সেই ভুল তথ্যের ওপর ভিত্তি করে সম্পূর্ণ কাল্পনিক একটি স্টোরি দাঁড় করিয়ে ফেলে, যার সঙ্গে বাস্তবের কোনো মিল নেই। তাছাড়া, এআইয়ের স্টোরি আইডিয়াগুলোও যে সম্পূর্ণ নতুন কিছু ছিল এমন নয়। মূলত, বিভিন্ন সময় বিভিন্ন গণমাধ্যমে করা স্টোরি আইডিয়া থেকে ধার নিয়েই এআই তার স্টোরি আইডিয়াগুলো সাজিয়েছে। সম্পূর্ণ নতুন বা সৃজনশীল কিছু করে দেখাতে পারেনি এআই প্রতিবেদক।
এরকম ভুল ও কাল্পনিক তথ্য ছড়িয়ে দেওয়ার পাশাপাশি এআইয়ের আরও বেশ কিছু ঝুঁকি রয়েছে। যেমন, সার্কাজম বা রূপকার্থ না বোঝা; ভাষা সহজ করতে গিয়ে গুরুত্বপুর্ণ তথ্য সরিয়ে ফেলা; অথবা, ব্যবহারকারীদের আচরণ বিশ্লেষণ করে কন্টেন্ট সাজেশন করতে গিয়ে তাদেরকে ফিল্টার বাবলের মধ্যে আটকে ফেলা।
এছাড়া ভেনিজুয়েলাতে ভার্চুয়াল অ্যাভাটার ব্যবহার করে ভুয়া সংবাদ আর প্রোপাগান্ডামূলক তথ্য ছড়িয়ে দেওয়ার অভিযোগও পাওয়া গিয়েছে।
শেষ কথা
বর্তমান সময়ে দাঁড়িয়ে এআইকে অগ্রাহ্য করে এগিয়ে যাওয়ার কোনো উপায় নেই। এআই আসার পর নিউজরুমের কাজের ধরনে অনেকটাই পরিবর্তন এসেছে, অনেক কিছুই হয়ে উঠেছে আরও সহজ।
এ প্রসঙ্গে লন্ডন স্কুল অফ ইকোনমিক্স-এর জার্নালিজমএআই প্রজেক্টের অধ্যাপক বেকেট মন্তব্য করেন, 'ইমেইল পাঠানো বা স্ক্রিপ্ট তৈরি করার মতো অতি সাধারণ ও সময়খরুচে কাজগুলোকে এআইয়ের ঘাড়ে চাপিয়ে দিয়ে প্রতিবেদকরা সেই সময়ে অন্য কাজ করতে পারেন। এ সময়টুকু প্রতিবেদকরা আরও বেশি সাক্ষাৎকার নেওয়ার কাজে ব্যয় করতে পারবেন। কিংবা এমন সব স্টোরি তৈরি করতে পারবেন যেগুলো আরও বেশি সৃজনশীল, আরও বেশি মতামতমূলক। এ ধরনের কাজগুলো যান্ত্রিক এআই খুব ভালোভাবে করতে পারবে না।'
তবে এআই যে দ্রুতগতিতে পরিবর্তন হচ্ছে, তাতে কোনোকিছুই নিশ্চিত করে বলা যায় না। ছয় মাসের মধ্যেই আমূল বদলে গিয়েছে সবকিছু। ছয় মাস পর আরও কী কী ব্যবহার করতে হবে, তাও অনুমান করা কঠিন। বিল গেটস এমনি এমনি জেনারেটিভ এআইয়ের আবিষ্কারকে কম্পিউটার আর ইন্টারনেট আবিষ্কারের মতো বৈপ্লবিক হিসেবে মত দেননি।
তাই এ অবস্থায় দাঁড়িয়ে স্কাইনিউজ-এর টম ক্লার্কের কথারই পুনরাবৃত্তি করতে হয়: 'যতদিন পর্যন্ত এআই মানুষের মতো কল্পনা না করতে পারছে, ততদিন পর্যন্ত আমার চাকরি খোয়ানোর ভয় নেই।'