‘আপনি কি রোবট?’ গুগল ক্যাপচা আমাদের এই প্রশ্ন করে কেন?
ধরুন এখন মধ্যরাত। আপনি সবে এককাপ কড়া কফি শেষ করেছেন, কারণ জরুরি কোনো কাজের ডেডলাইন এগিয়ে আসছে। দ্রুত ইন্টারনেটে কিছু খোঁজার জন্য কম্পিউটার খুলে বসলেন… ঠিক এমন সময় ওয়বেপেজ যদি আপনাকে জিজ্ঞেস করে 'আপনি কি একটা রোবট?', তখন মেজাজ বিগড়ে যাওয়া অস্বাভাবিক নয়!
সেই মুহূর্তে আপনাকে হয়তো ব্রিজ, গাড়ি কিংবা ট্রাফিক লাইটসহ কিছু ছবি বাছাই করতে বলা হবে আপনার 'মানুষ' পরিচয় নিশ্চিত করার জন্য। 'ক্যাপচা' বলে পরিচিত এ বিষয়টি আমাদের কাছে যথেষ্ট বিরক্তিকর বা হাস্যকর মনে হলেও, কখনো কি এর পেছনের কারণ বের করার চেষ্টা করেছি?
ক্যাপচা কী এবং কেন থাকে?
ইন্টারনেটে যথেষ্ট সময় ব্যয় করেন কিন্তু ক্যাপচার সাথে পরিচিত নন, এমন মানুষ খুঁজে পাওয়া কঠিন। কিন্তু প্রশ্ন হচ্ছে ক্যাপচা আসলে কি? ইন্টারনেট জগতে প্রথমেই আমরা এর মুখোমুখি হই কেন?
একটি কম্পিউটারের 'চিন্তা করা'র ক্ষমতা আছে কিনা তা পরীক্ষা করার জন্য 'টুরিং টেস্ট' নামক একটি পদ্ধতি চালু করেন গণিতবিদ অ্যালান টুরিং। ক্যাপচা বিশ্বে সবচেয়ে বেশি ব্যবহৃত টুরিং টেস্ট। ক্যাপচার পূর্ণ রূপ হলো 'কমপ্লিটলি অটোমেটেড পাবলিক টুরিং টেস্ট টু টেল কম্পিউটারস অ্যান্ড হিউম্যানস অ্যাপার্ট'।
ক্যাপচা ব্যবহৃত হয় সত্যিকারের ইন্টারনেট ব্যবহারকারী এবং স্বয়ংক্রিয় ব্যবহারকারীর মধ্যে পার্থক্য বুঝতে। যেমন, ইন্টারনেট বট হলো একটি স্বয়ংক্রিয় ব্যবহারকারী। ক্যাপচার সবচেয়ে সহজ রূপ হলো ব্যবহারকারীকে কিছু অক্ষর বা সংখ্যা লিখতে দেওয়া যা তারা স্ক্রিনে দেখেছে বা শুনেছে।
সাধারণত ছবিতে দেওয়া অক্ষর বা সংখ্যাগুলো এমনভাবে বিকৃত রাখা হয় যা স্বয়ংক্রিয় ব্যবহারকারীর পক্ষে সমাধান করা কঠিন হয়ে পড়ে। কিন্তু একজন মানুষ এর সঠিক উত্তর দিতে পারবে। অবৈধ একাউন্ট তৈরি, ব্লগ ও ফোরামগুলোতে স্প্যাম কমেন্ট ঠেকানো, পোলের যথার্থতা বজায় রাখার মতো কাজে আমাদের সুরক্ষা দিতে পারে ক্যাপচা।
ক্যাপচার অসুবিধাগুলো কী কী?
ক্যাপচা যেমন আমাদের নিরাপত্তা দেয়, তেমনি এর কিছু খুঁতও রয়েছে।
২০০০ সালের দিকে স্রেফ প্যাঁচানো দুর্বোধ্য অক্ষর দিয়েই বেশিরভাগ স্প্যামবটকে রুখে দিতে পারতো ক্যাপচা। কিন্তু এক দশক পরে যখন গুগল তাদের 'গুগল বুকস প্রজেক্ট'- এর জন্য বই ও ম্যাগাজিনগুলো ডিজিটালাইজ করতে শুরু করলো; তখনই স্ক্যানিংয়ে ভুল হওয়ার সমস্যা প্রকট হতে লাগলো।
তাহলে এ সমস্যার সমাধান হলো কিভাবে? এবার গুগল পেলসিলভানিয়ার কার্নেগি মেলন বিশ্ববিদ্যালয়ের গবেষকদের সহায়তায় 'রিক্যাপচা' প্রোগ্রাম নিয়ে এলো এবং ক্যাপচা পরীক্ষায় স্ক্যান করা বই থেকে টেক্সটের ডিজিটাল ছবি প্রদর্শনের প্রক্রিয়া চালু হলো। তাই ইন্টারনেট ব্যবহারকারীরা যখন ওই টেক্সট দেখে টাইপ করতে থাকে তখন তা ডিজিটাল ডকুমেন্ট হিসেবে সংরক্ষন করা হয়। এর মাধ্যমে গুগলের অপটিক্যাল ক্যারেক্টার রিকগনিশন অ্যালগরিদম আরও এক ধাপ এগিয়ে যায়।
প্রতিনিয়ত অসংখ্য মানুষ লাখ লাখ ক্যাপচা সমাধান করছে। কিন্তু এর মধ্য দিয়েই আবার মানুষ এএলএসকে (ALS) প্রশিক্ষণ দিচ্ছে বিভিন্ন সমস্যা সমাধানের জন্য। তাই এএলএস প্রযুক্তি যে একসময় মানুষকে পেছনে ফেলবে তা অবধারিতই ছিল।
এই মুহূর্তে বিশ্বের সবচেয়ে উল্লেখযোগ্য ক্যাপচা প্রযুক্তি 'রিক্যাপচা'র মালিক গুগল। ২০১৪ সালে গুগল দেখে যে সবচেয়ে জটিল ক্যাপচাগুলো সমাধানের ক্ষেত্রে তাদেরই একটি মেশিন লার্নিং অ্যালগরিদম ৯৯ দশমিক ৮ শতাংশ সফল। অন্যদিকে একই ক্যাপচা সমাধানে মানুষের সফলতার হার মাত্র ৩৩ শতাংশ! তাই এ সমস্যা মোকাবিলা করতে গুগল 'নোক্যাপচা রিক্যাপচা' নামক আলাদা একটি প্রযুক্তি উদ্ভাবন করে। এটি ইন্টারনেট ব্যবহারকারীদের ডেটা এবং আচরণের ধরন পর্যবেক্ষণ করে; কিছু ব্যবহারকারীকে তারা 'আই অ্যাম নট আ রোবট' লেখা চেকবক্সে টিক চিহ্নসহ এই পরীক্ষা উতরে যেতে দেয়, এবং বাকিদেরকে ছবিসহ পরীক্ষার সামনে ফেলে।
তবে ক্যাপচা প্রযুক্তির সাথে পাল্লা দিয়ে দিন দিন বট প্রযুক্তিও উন্নত হতে থাকে। তাই গুগলকেও রিক্যাপচা'র নিত্যনতুন সংস্করণ বের করতে হয়। এই মুহূর্তে আমরা এমন একটি পরিস্থিতিতে আছি যেখানে ক্যাপচা মানুষের জন্য কঠিন, কিন্তু বটের জন্যই বরং সহজ হয়ে দাঁড়িয়েছে!
বিকল্প উপায় কী?
ক্যাপচার বিকল্প খুঁজতে গিয়ে গবেষকদের যেসব চ্যালেঞ্জ মোকাবিলা করতে হচ্ছে তার মধ্যে সবচেয়ে বড় চ্যালেঞ্জ হলো- বিশ্বে অসংখ্য আলাদা ভাষা, সংস্কৃতি ও ধর্মের মানুষ রয়েছে এবং তাদের জীবনে অভিজ্ঞতার ভান্ডারও আলাদা। তাই সব ধর্ম-বর্ণ-ভাষার উর্ধ্বে গিয়ে মানুষের মনুষ্যত্ব প্রমাণ করার মতো ক্যাপচা তৈরি করা গবেষকদের জন্য কঠিন হয়ে দাঁড়িয়েছে।
ক্যাপচার বিকল্প হিসেবে 'গেমিফিকেশন' নামক একটি প্রযুক্তি উত্থাপন করা হয়েছে। হ্যাঁ, এটিও আপনার ইন্টারনেট ব্যবহারের গতিকে ধীর করবে বটে; কিন্তু একই সাথে এর মধ্যে কিছু মজাদার বৈশিষ্ট্যও থাকবে। তবে কোন পরিস্থিতিতে কাকে কি জিজ্ঞেস করা হচ্ছে, তার উপর ভিত্তি করে ক্যাপচা মানুষকে বিনোদন দিতে পারে, আবার রাগিয়েও তুলতে পারে।
আরেকটি সমাধান হলো 'হানিপট' নামক একটি প্রযুক্তি ব্যবহার, যেখানে ওয়েবপেজে 'হিডেন ফিল্ড' থাকে যা শুধুমাত্র মানুষের সামনেই দৃশ্যমান হয়, কোনো স্বয়ংক্রিয় প্রযুক্তির সামনে নয়।
কিছু বিশেষজ্ঞের মতে, ক্যাপচা পরীক্ষার বদলে ব্যবহারকারীর আচরণের ধরন পর্যবেক্ষণের মাধ্যমে 'কন্টিনিউয়াস অথেনটিকেশন' প্রয়োগ করা যেতে পারে।
তাছাড়া ভিন্ন কোনো রূপেও ক্যাপচাকে নিয়ে আসা যায়। ২০১৭ সালে আমাজন একটি নতুন পদ্ধতি আবিষ্কারের জন্য পেটেন্ট লাভ করে। পদ্ধতিটি এরকম যে ব্যবহারকারীর সামনে কিছু চ্যালেঞ্জ ছুঁড়ে দেওয়া হবে এবং ব্যবহারকারী যদি মানুষ হয় তাহলে এমনিতেই সে প্রশ্নগুলোর ভুল উত্তর দিবে এবং পেজে প্রবেশ করতে পারবে।
'টুরিং টেস্ট ভায়া ফেইলিওর' নামক এই প্রযুক্তির বৈশিষ্ট্যই হচ্ছে ভুল উত্তর দেওয়ার মাধ্যমে চ্যালেঞ্জে সফল হওয়া। কিন্তু এই প্রযুক্তিকে ধোঁকা দিতে সক্ষম, এমন বটও তৈরি করা সম্ভব বলে মনে করা হচ্ছে। এমন সন্দেহের জবাবে উদ্ভাবনকারীরা বলছেন, স্বয়ংক্রিয় বটের উত্তর দেওয়ার ধরন মানুষের থেকে আলাদা হবে যা সহজেই এই সিস্টেমে ধরা পড়বে।
এন্ডগেম
ইউক্রেনের ওডেসা শহরের বাসিন্দা ১৩ বছর বয়সী ইউজেন গুস্টম্যান। ইউজেনের বাবা একজন গাইনোকোলজিস্ট এবং তার একটি পোষা গিনিপিগ রয়েছে।
অ্যালান টুরিং এর ৬০তম মৃত্যুবার্ষিকী উপলক্ষে আয়োজিত একটি টুরিং টেস্ট প্রতিযোগিতার অন্তত ৩৩ শতাংশ বিচারক মনে করেন, ইউজেন একজন সত্যিকার মেধাবী ছেলে। তাদের ভাষ্যে, ইউজেন বাস্তবে ২০০১ সালে উদ্ভাবিত একটি চ্যাটবটের মতোই বুদ্ধিমান। এই চ্যাটবটটি নিজস্ব বুদ্ধি, রসবোধ এবং দুর্বল ইংরেজি ব্যবহারের ভান করার মাধ্যমে বিচারকদের ধোকা দিতে পারে। ফলে বিচারকেরা ধরে নেন যে একজন সত্যিকার মানুষই তখন ইন্টারনেট ব্যবহার করছে!
তাহলে বটও যদি মানুষের মতো ভুল করতে শুরু করে তখন কি হবে? আনাড়িভাবে ওয়েবপেজে ঢোকা, টাইপিংয়ে ভুল করা এবং ব্রাউজার ট্যাবগুলোতে আসাযাওয়ার মধ্যে থাকার মতো কাজগুলো কি এএল প্রযুক্তিতেও রয়েছে?
তার মানে কি 'মানুষমাত্রই ভুল করে' প্রবাদ সত্য নয়? তাহলে 'মানুষ' মানে কি? দুনিয়ার সব মানুষের মধ্যে এমন কোনো সাধারণ বৈশিষ্ট্য আছে কি যা কোনো মেশিন কখনো অনুকরণ করতে পারবে না, কিন্তু একই সাথে অন্য মেশিন তা বুঝতে পারবে?