
Roomba থেকে রোবট অনেক দূর এগিয়ে এসেছে। আজ, ড্রোনগুলি ঘরে ঘরে পণ্য সরবরাহ করতে শুরু করেছে, স্ব-চালিত গাড়িগুলি কিছু রাস্তায় ঘুরে বেড়াচ্ছে, রোবো-কুকুরগুলি প্রথম প্রতিক্রিয়াকারীদের সহায়তা করছে এবং এখনও আরও অনেক বট ব্যাকফ্লিপ করছে এবং কারখানার মেঝেতে সাহায্য করছে৷ তবুও, লুকা কার্লোন মনে করেন সেরাটা এখনও আসতে বাকি।
কার্লোন, যিনি সম্প্রতি এমআইটি-এর অ্যারোনটিক্স অ্যান্ড অ্যাস্ট্রোনটিক্স ডিপার্টমেন্টে (অ্যারোঅ্যাস্ট্রো) একজন সহযোগী অধ্যাপক হিসেবে দায়িত্ব পালন করেছেন, তিনি স্পার্ক ল্যাব পরিচালনা করেন, যেখানে তিনি এবং তার ছাত্ররা মানুষ এবং রোবটের মধ্যে একটি গুরুত্বপূর্ণ ব্যবধান তৈরি করছেন: উপলব্ধি। গোষ্ঠীটি তাত্ত্বিক এবং পরীক্ষামূলক গবেষণা পরিচালনা করে যা মানুষের উপলব্ধির কাছে যাওয়ার উপায়ে তাদের পরিবেশ সম্পর্কে রোবটদের সচেতনতাকে প্রসারিত করে। এবং উপলব্ধি, যেমন কার্লোন প্রায়শই বলে, স্বীকৃতির চেয়ে বেশি।
যদিও রোবটগুলি তাদের আশেপাশের বস্তুগুলি সনাক্ত এবং শনাক্ত করার ক্ষমতার দিক থেকে দ্রুত বৃদ্ধি পেয়েছে, তাদের পরিবেশ সম্পর্কে উচ্চ-স্তরের বোঝা তৈরি করার ক্ষেত্রে তাদের এখনও অনেক কিছু শিখতে হবে। মানুষ হিসাবে, আমরা বস্তুগুলিকে শুধুমাত্র তাদের আকার এবং লেবেল নয় বরং তাদের পদার্থবিদ্যার একটি স্বজ্ঞাত বোধের সাথে উপলব্ধি করি – কীভাবে সেগুলিকে চালিত করা যায় এবং সরানো যায় – এবং কীভাবে তারা একে অপরের সাথে, তাদের বৃহত্তর পরিবেশ এবং নিজেদের সাথে সম্পর্কিত।
এই ধরনের মানব-স্তরের উপলব্ধি কার্লোন এবং তার গোষ্ঠী রোবটগুলিকে সরবরাহ করার আশা করছে, তাদের বাড়ি, কর্মক্ষেত্র এবং অন্যান্য অসংগঠিত পরিবেশে মানুষের সাথে নিরাপদে এবং নির্বিঘ্নে যোগাযোগ করতে সক্ষম করবে৷
2017 সালে MIT অনুষদে যোগদানের পর থেকে, কার্লোন স্বায়ত্তশাসিত ভূগর্ভস্থ অনুসন্ধান-এবং-উদ্ধার যানবাহন, ড্রোন যা উড়তে থাকা বস্তুগুলিকে বাছাই করতে এবং পরিচালনা করতে পারে এবং স্ব-চালিত গাড়ি সহ বিভিন্ন অ্যাপ্লিকেশনে উপলব্ধি এবং দৃশ্য-বোঝার অ্যালগরিদম বিকাশ এবং প্রয়োগে তার দলকে নেতৃত্ব দিয়েছে। এগুলি হোম রোবটগুলির জন্যও কার্যকর হতে পারে যা প্রাকৃতিক ভাষার আদেশগুলি অনুসরণ করে এবং সম্ভাব্য এমনকি উচ্চ-স্তরের প্রাসঙ্গিক সূত্রের উপর ভিত্তি করে মানুষের প্রয়োজনগুলিও প্রত্যাশা করে।
কার্লোন বলেছেন, “বাস্তব জগতে আমাদের সাহায্য করার জন্য রোবট পাওয়ার দিকে উপলব্ধি একটি প্রধান বাধা।” “যদি আমরা রোবট উপলব্ধিতে জ্ঞান এবং যুক্তির উপাদান যোগ করতে পারি, আমি বিশ্বাস করি তারা অনেক ভাল করতে পারে।”
প্রসারিত দিগন্ত
কার্লোনের জন্ম এবং বেড়ে ওঠা ইতালির সালেরনো, সুন্দর আমালফি উপকূলের কাছে, যেখানে তিনি তিন ছেলের মধ্যে সর্বকনিষ্ঠ ছিলেন। তার মা একজন অবসরপ্রাপ্ত প্রাথমিক বিদ্যালয়ের শিক্ষক যিনি গণিত পড়াতেন, এবং তার বাবা একজন অবসরপ্রাপ্ত ইতিহাসের অধ্যাপক এবং প্রকাশক, যিনি সর্বদা তার ঐতিহাসিক গবেষণার জন্য একটি বিশ্লেষণাত্মক পদ্ধতি গ্রহণ করেছেন। ভাইরা হয়ত অজান্তেই তাদের বাবা-মায়ের মানসিকতা গ্রহণ করেছিল, কারণ তিনজনই ইঞ্জিনিয়ার হয়েছিলেন – বড় দুইজন ইলেকট্রনিক্স এবং মেকানিক্যাল ইঞ্জিনিয়ারিং এর পেছনে ছুটতেন, যখন কার্লোন রোবোটিক্স বা মেকাট্রনিক্সের দিকে ঝুঁকে পড়েছিলেন যেমনটি সেই সময়ে পরিচিত ছিল।
তবে স্নাতক শেষ না হওয়া পর্যন্ত তিনি মাঠে নামেননি। কার্লোন তুরিনের পলিটেকনিক ইউনিভার্সিটিতে যোগদান করেন, যেখানে তিনি প্রাথমিকভাবে তাত্ত্বিক কাজের উপর মনোযোগ দেন, বিশেষ করে নিয়ন্ত্রণ তত্ত্বের উপর – এমন একটি ক্ষেত্র যা অ্যালগরিদম বিকাশের জন্য গণিত প্রয়োগ করে যা পাওয়ার গ্রিড, প্লেন, গাড়ি এবং রোবটের মতো শারীরিক সিস্টেমের আচরণ স্বয়ংক্রিয়ভাবে নিয়ন্ত্রণ করে। তারপরে, তার জ্যেষ্ঠ বছরে, কার্লোন রোবোটিক্সের একটি কোর্সের জন্য সাইন আপ করেন, যা ম্যানিপুলেশনের অগ্রগতি এবং কীভাবে রোবটগুলিকে সরানো এবং কাজগুলি সম্পাদন করার জন্য প্রোগ্রাম করা যেতে পারে তা অন্বেষণ করে।
“এটি প্রথম দর্শনে প্রেম ছিল। একটি রোবটের মস্তিষ্কের বিকাশ করা এবং এটিকে কাজ করতে এবং পরিবেশের সাথে ইন্টারঅ্যাক্ট করার জন্য অ্যালগরিদম এবং গণিত ব্যবহার করা সবচেয়ে আনন্দদায়ক অভিজ্ঞতাগুলির মধ্যে একটি,” বলেছেন কার্লোন৷ “আমি এখনই সিদ্ধান্ত নিয়েছি যে আমি জীবনে এটাই করতে চাই।”
তিনি তুরিনের পলিটেকনিক ইউনিভার্সিটি এবং মিলানের পলিটেকনিক ইউনিভার্সিটিতে দ্বৈত ডিগ্রি প্রোগ্রামে যান, যেখানে তিনি যথাক্রমে মেকাট্রনিক্স এবং অটোমেশন ইঞ্জিনিয়ারিংয়ে স্নাতকোত্তর ডিগ্রি অর্জন করেন। Alta Scuola Politecnica নামক এই প্রোগ্রামের অংশ হিসেবে, Carlone ব্যবস্থাপনার কোর্সও নিয়েছিল, যেখানে তাকে এবং বিভিন্ন একাডেমিক ব্যাকগ্রাউন্ডের অন্যান্য ছাত্রদেরকে একটি নতুন পণ্য ডিজাইনের জন্য ধারণা তৈরি করতে, তৈরি করতে এবং একটি মার্কেটিং পিচ প্রস্তুত করতে দলবদ্ধ হতে হয়েছিল। কার্লোনের দল একটি স্পর্শ-মুক্ত টেবিল ল্যাম্প তৈরি করেছে যা ব্যবহারকারীর হাত দ্বারা পরিচালিত কমান্ড অনুসরণ করার জন্য ডিজাইন করা হয়েছে। এই প্রকল্পটি তাকে বিভিন্ন দৃষ্টিকোণ থেকে প্রকৌশল সম্পর্কে চিন্তা করতে অনুপ্রাণিত করেছিল।
“এটি বিভিন্ন ভাষায় কথা বলার মত ছিল,” তিনি বলেছেন। “এটি ইঞ্জিনিয়ারিং বুদ্বুদের বাইরে দেখার এবং বাস্তব বিশ্বকে প্রভাবিত করতে পারে এমন প্রযুক্তিগত কাজ কীভাবে তৈরি করা যায় সে সম্পর্কে চিন্তা করার প্রয়োজনীয়তার প্রাথমিক প্রদর্শন ছিল।”
পরবর্তী প্রজন্ম
কার্লোন মেকাট্রনিক্সে তার পিএইচডি সম্পন্ন করতে তুরিনে থেকে যান। সেই সময়ে, তাকে একটি থিসিস বিষয় বেছে নেওয়ার স্বাধীনতা দেওয়া হয়েছিল, যা তিনি “একটু সরলভাবে” স্মরণ করেছিলেন।
“আমি এমন একটি বিষয় অন্বেষণ করছিলাম যা সম্প্রদায়ের দ্বারা ভালভাবে বোঝা গিয়েছিল, এবং যে সম্পর্কে অনেক গবেষক বিশ্বাস করেছিলেন যে আর কিছু বলার নেই।” কার্লোন বলেছেন। “বিষয়টি কীভাবে প্রতিষ্ঠিত হয়েছিল তা আমি অবমূল্যায়ন করেছি, এবং ভেবেছিলাম যে আমি এখনও এতে নতুন কিছু অবদান রাখতে পারি, এবং আমি এটি করতে যথেষ্ট ভাগ্যবান।”
বিবেচ্য বিষয় ছিল “একযোগে স্থানীয়করণ এবং ম্যাপিং” বা SLAM – একটি রোবটের পরিবেশের একটি মানচিত্র তৈরি এবং আপডেট করার সমস্যা, একই সাথে সেই পরিবেশের মধ্যে রোবটটি কোথায় রয়েছে তা ট্র্যাক করা। কার্লোন সমস্যাটিকে পুনরায় আকার দেওয়ার একটি উপায় বের করেছিলেন যাতে অ্যালগরিদম প্রাথমিক অনুমান না করেই আরও সঠিক মানচিত্র তৈরি করতে পারে, যেমনটি সেই সময়ে বেশিরভাগ SLAM পদ্ধতি করেছিল। তার কাজ এমন একটি ক্ষেত্র খুলতে সাহায্য করেছিল যেখানে বেশিরভাগ রোবোটিস্টরা মনে করেছিলেন যে বিদ্যমান অ্যালগরিদমগুলির চেয়ে ভাল কেউ করতে পারে না।
কার্লোন বলেছেন, “স্ল্যাম জিনিসগুলির জ্যামিতি বের করা এবং একটি রোবট কীভাবে সেই জিনিসগুলির মধ্যে চলে তা খুঁজে বের করা। “আমি এখন এমন একটি সম্প্রদায়ের অংশ যারা জিজ্ঞাসা করছে SLAM এর পরবর্তী প্রজন্ম কী?”
উত্তরের সন্ধানে, তিনি জর্জিয়া টেক-এ একটি পোস্টডক অবস্থান গ্রহণ করেছিলেন, যেখানে তিনি কোডিং এবং কম্পিউটার দৃষ্টিতে কাজ করেছিলেন – এমন একটি ক্ষেত্র যা, পিছনে তাকালে, অন্ধত্ব দ্বারা অনুপ্রাণিত হতে পারে: যখন তিনি ইতালিতে তার পিএইচডি সম্পন্ন করছিলেন, তখন তিনি একটি চিকিৎসা জটিলতায় ভুগেছিলেন যা তার দৃষ্টিকে মারাত্মকভাবে প্রভাবিত করেছিল৷
“এক বছরের জন্য, আমি সহজেই একটি চোখ হারাতে পারতাম,” কার্লোন বলে। “এটি এমন কিছু ছিল যা আমাকে দৃষ্টি এবং কৃত্রিম দৃষ্টিভঙ্গির গুরুত্ব সম্পর্কে ভাবতে বাধ্য করেছিল।”
তিনি ভাল চিকিৎসা সেবা পেতে সক্ষম হন, এবং অবস্থা সম্পূর্ণরূপে পুনরুদ্ধার হয়, যাতে তিনি তার কাজ চালিয়ে যেতে পারেন। জর্জিয়া টেক-এ, তার উপদেষ্টা, ফ্র্যাঙ্ক ডেলার্ট, তাকে দেখিয়েছিলেন কীভাবে কম্পিউটার দৃষ্টিতে কোড করতে হয় এবং জটিল, ত্রিমাত্রিক সমস্যার মার্জিত গাণিতিক উপস্থাপনা তৈরি করতে হয়। তার উপদেষ্টা ছিলেন GTSAM নামে একটি ওপেন-সোর্স SLAM লাইব্রেরি গড়ে তোলার প্রথম একজন, যা Carlone অবিলম্বে একটি অমূল্য সম্পদ হিসাবে স্বীকৃত। আরও বিস্তৃতভাবে, তিনি দেখেছিলেন যে সকলের জন্য সফ্টওয়্যার উপলব্ধ করা সামগ্রিকভাবে রোবোটিক্সে অগ্রগতির জন্য একটি দুর্দান্ত সম্ভাবনার প্রস্তাব দেয়।
“ঐতিহাসিকভাবে, SLAM-এ অগ্রগতি খুব ধীর ছিল, কারণ লোকেরা তাদের কোডের মালিকানা রেখেছিল, এবং প্রতিটি গোষ্ঠীকে মূলত স্ক্র্যাচ থেকে শুরু করতে হয়েছিল,” কার্লোন বলেছেন। “তারপরে ওপেন সোর্স পাইপলাইনগুলি বেরিয়ে আসতে শুরু করে, এবং এটি একটি গেম চেঞ্জার ছিল, যা আমরা গত 10 বছরে যে অগ্রগতি দেখেছি তার অনেকটাই চালিত করে।”
স্থানিক এআই
জর্জিয়া টেকের পরে, কার্লোন 2015 সালে এমআইটিতে তথ্য ও সিদ্ধান্ত সিস্টেমের (LIDS) জন্য ল্যাবরেটরিতে পোস্টডক হিসেবে আসেন। সেই সময়ে, তিনি সারতাক কারামান, অ্যারোনটিক্স এবং অ্যাস্ট্রোনটিক্সের অধ্যাপকের সাথে সহযোগিতা করেছিলেন, যাতে সফ্টওয়্যার তৈরি করা হয় যাতে পাম-আকারের ড্রোনগুলি খুব কম অন-বোর্ড শক্তি ব্যবহার করে তাদের চারপাশে নেভিগেট করতে সহায়তা করে। এক বছর পরে, তিনি গবেষণা বিজ্ঞানী হিসাবে উন্নীত হন এবং তারপরে 2017 সালে, কার্লোন AeroAstro-এ একটি অনুষদের পদ গ্রহণ করেন।
কার্লোন বলেছেন, “এমআইটি সম্পর্কে আমি একটি জিনিস পছন্দ করেছি যে সমস্ত সিদ্ধান্তগুলি প্রশ্ন দ্বারা চালিত হয়: আমাদের মূল্যবোধ কী? আমাদের লক্ষ্য কী? এটি কখনই নিম্ন-স্তরের লাভের বিষয়ে নয়। অনুপ্রেরণাটি আসলে সমাজকে আরও উন্নত করার বিষয়ে।” “একটি মানসিকতা হিসাবে, এটি খুব সতেজ হয়েছে।”
আজ, কার্লোনের গোষ্ঠী তার জ্যামিতিক আকার এবং শব্দার্থকে চিত্রিত করার বাইরে, একটি রোবটের আশেপাশের প্রতিনিধিত্ব করার উপায়গুলি বিকাশ করছে৷ তিনি অ্যালগরিদম বিকাশের জন্য গভীর শিক্ষা এবং বড় ভাষা মডেল ব্যবহার করছেন যা রোবটগুলিকে একটি উচ্চ-স্তরের লেন্সের মাধ্যমে তাদের পরিবেশ বুঝতে সক্ষম করে। গত ছয় বছরে, তার পরীক্ষাগার 60টিরও বেশি ওপেন সোর্স রিপোজিটরি প্রকাশ করেছে, যা বিশ্বব্যাপী হাজার হাজার গবেষক এবং অনুশীলনকারীরা ব্যবহার করেন। তাদের কাজের বেশিরভাগই একটি বৃহত্তর, উদীয়মান ক্ষেত্রের সাথে ফিট করে যা “স্পেশিয়াল এআই” নামে পরিচিত।
“স্পেশিয়াল এআই স্টেরয়েডের উপর স্ল্যামের মত,” কার্লোন বলেছেন। “সংক্ষেপে, এটি রোবটকে মানুষের মতো বিশ্বকে চিন্তা করতে এবং বুঝতে সক্ষম করার বিষয়ে, এমন উপায়ে যা দরকারী হতে পারে।”
এটি একটি বিশাল উদ্যোগ যা বাড়িতে, কর্মক্ষেত্রে, রাস্তায় এবং দূরবর্তী এবং সম্ভাব্য বিপজ্জনক এলাকায় সাহায্য করার জন্য আরও স্বজ্ঞাত, ইন্টারেক্টিভ রোবটগুলিকে সক্ষম করার ক্ষেত্রে বিস্তৃত প্রভাব ফেলতে পারে। কার্লোন বলেছেন যে মানুষ কীভাবে বিশ্বকে দেখে তার কাছাকাছি যাওয়ার জন্য সামনে অনেক কাজ আছে।
“আমার 2 বছর বয়সী যমজ কন্যা আছে, এবং আমি তাদের বস্তুর কারসাজি করতে দেখি, এক সময়ে 10টি ভিন্ন খেলনা বহন করতে, সহজে বিশৃঙ্খল ঘরে নেভিগেট করতে এবং দ্রুত নতুন পরিবেশের সাথে খাপ খাইয়ে নিতে দেখেছি। রোবটের উপলব্ধি এখনও একটি বাচ্চা যা করতে পারে তার সাথে মেলে না,” কার্লোন বলেছেন৷ “তবে আমাদের অস্ত্রাগারে নতুন সরঞ্জাম রয়েছে। এবং ভবিষ্যত উজ্জ্বল।”