
সিয়েরা নেভাডায় দাবানল নিভানোর জন্য জল বহনকারী একটি স্বায়ত্তশাসিত ড্রোন সান্তা আনার বাঁকানো বাতাসের মুখোমুখি হতে পারে যা এটিকে উড়িয়ে দেওয়ার হুমকি দেয়৷ ফ্লাইটের সময় এই অজানা ঝামেলার সাথে দ্রুত মানিয়ে নেওয়া ড্রোনের ফ্লাইট কন্ট্রোল সিস্টেমের জন্য একটি বড় চ্যালেঞ্জ।
এই জাতীয় ড্রোনগুলিকে লক্ষ্যে থাকতে সাহায্য করার জন্য, এমআইটি গবেষকরা একটি নতুন, মেশিন লার্নিং-ভিত্তিক অভিযোজিত নিয়ন্ত্রণ অ্যালগরিদম তৈরি করেছেন যা উচ্চ বাতাসের মতো অনাকাঙ্ক্ষিত শক্তির মুখোমুখি হয়ে এর অভিপ্রেত গতিপথ থেকে এর বিচ্যুতি কমাতে পারে।
স্ট্যান্ডার্ড পদ্ধতির বিপরীতে, নতুন প্রযুক্তির জন্য একটি স্বায়ত্তশাসিত ড্রোন প্রোগ্রামিং করা ব্যক্তিকে এই অনিশ্চিত বিভ্রান্তির গঠন সম্পর্কে আগাম কিছু জানার প্রয়োজন হয় না। পরিবর্তে, কন্ট্রোল সিস্টেমের কৃত্রিম বুদ্ধিমত্তা মডেলটি 15 মিনিটের ফ্লাইটের সময় সংগৃহীত অল্প পরিমাণ পর্যবেক্ষণমূলক ডেটা থেকে যা জানা দরকার তা শিখে।
গুরুত্বপূর্ণভাবে, কৌশলটি স্বয়ংক্রিয়ভাবে নির্ধারণ করে যে কোন অভিযোজন অ্যালগরিদমটি এটিকে ব্যাঘাতের সাথে খাপ খাইয়ে নিতে ব্যবহার করবে, যার ফলে ট্র্যাকিং কর্মক্ষমতা উন্নত হবে। এটি এমন অ্যালগরিদম বেছে নেয় যা এই ড্রোনের মুখোমুখি হওয়া নির্দিষ্ট ঝামেলার জ্যামিতির সাথে সবচেয়ে উপযুক্ত।
গবেষকরা তাদের নিয়ন্ত্রণ ব্যবস্থাকে মেটা-লার্নিং নামক একটি কৌশল ব্যবহার করে একই সাথে উভয় কাজ করার জন্য প্রশিক্ষিত করেছেন, যা সিস্টেমকে বিভিন্ন ধরণের বিশৃঙ্খলার সাথে খাপ খাইয়ে নিতে শেখায়।
একত্রে নেওয়া, এই উপাদানগুলি তাদের অভিযোজিত নিয়ন্ত্রণ ব্যবস্থাকে সিমুলেশনে বেসলাইন পদ্ধতির তুলনায় 50 শতাংশ কম ট্র্যাজেক্টরি ট্র্যাকিং ত্রুটি অর্জন করতে সক্ষম করে এবং নতুন বায়ু গতির সাথে আরও ভাল পারফর্ম করে যা প্রশিক্ষণের সময় পর্যবেক্ষণ করা হয়নি।
ভবিষ্যতে, এই অভিযোজিত নিয়ন্ত্রণ ব্যবস্থা স্বায়ত্তশাসিত ড্রোনগুলিকে আরও দক্ষতার সাথে ভারী পার্সেল সরবরাহ করতে সাহায্য করতে পারে প্রবল বাতাস থাকা সত্ত্বেও বা জাতীয় উদ্যানের অগ্নি-প্রবণ এলাকাগুলি পর্যবেক্ষণ করতে পারে।
“এই উপাদানগুলির সমসাময়িক শিক্ষাই আমাদের পদ্ধতিকে শক্তি দেয়৷ মেটা-লার্নিংকে কাজে লাগানোর মাধ্যমে, আমাদের নিয়ামক স্বয়ংক্রিয়ভাবে পছন্দগুলি বেছে নিতে পারে যা দ্রুত অপ্টিমাইজেশানের জন্য সবচেয়ে ভাল হবে,” বলেছেন নাভিদ আজিজান, এমআইটি-এর মেকানিক্যাল ইঞ্জিনিয়ারিং বিভাগের সহকারী অধ্যাপক এবং হ্যারল্ড ই. এডগারটনের সহকারী অধ্যাপক এবং ইনস্টিটিউট ফর ডেটা, সিস্টেমস, এবং ইনফরমেশন সোসাইটি (এসএসআইডি) এবং লার্নিং ইনস্টিটিউট অফ ইনফরমেশন ডিসিশন সিস্টেমস (LIDS), এবং এই কন্ট্রোল সিস্টেমের উপর একটি কাগজের সিনিয়র লেখক।
আজিজানের সাথে, কাগজের প্রধান লেখকদের মধ্যে রয়েছে অ্যারোনটিক্স এবং অ্যাস্ট্রোনটিক্স বিভাগের একজন স্নাতক ছাত্র সানবোচেন ট্যাং এবং ইলেকট্রিক্যাল ইঞ্জিনিয়ারিং এবং কম্পিউটার সায়েন্স বিভাগের স্নাতক ছাত্র হাওয়ুয়ান সান। এই গবেষণাটি সম্প্রতি লার্নিং ফর ডাইনামিকস অ্যান্ড কন্ট্রোল কনফারেন্সে উপস্থাপিত হয়েছিল।
সঠিক অ্যালগরিদম খোঁজা
সাধারণত, একটি নিয়ন্ত্রণ ব্যবস্থায় একটি ফাংশন অন্তর্ভুক্ত থাকে যা ড্রোন এবং এর পরিবেশকে মডেল করে এবং সম্ভাব্য ব্যাঘাতের কাঠামোর উপর কিছু বিদ্যমান তথ্য অন্তর্ভুক্ত করে। কিন্তু অনিশ্চিত পরিস্থিতিতে পূর্ণ বাস্তব জগতে, এই কাঠামোটি আগে থেকেই ডিজাইন করা প্রায়শই অসম্ভব।
অনেক কন্ট্রোল সিস্টেম সমস্যাটির অজানা অংশগুলি অনুমান করতে এবং ফ্লাইটের সময় ড্রোনটিকে তার লক্ষ্যবস্তুর গতিপথের যতটা সম্ভব কাছাকাছি রাখা যায় তা নির্ধারণ করতে গ্রেডিয়েন্ট ডিসেন্ট নামে পরিচিত একটি জনপ্রিয় অপ্টিমাইজেশন অ্যালগরিদমের উপর ভিত্তি করে একটি অপ্টিমাইজেশন পদ্ধতি ব্যবহার করে। যাইহোক, গ্রেডিয়েন্ট ডিসেন্ট বেছে নেওয়ার জন্য উপলব্ধ অ্যালগরিদমের একটি বৃহৎ পরিবারে শুধুমাত্র একটি অ্যালগরিদম রয়েছে, যা মিরর ডিসেন্ট নামে পরিচিত।
“মিরর ডিসেন্ট হল অ্যালগরিদমগুলির একটি সাধারণ পরিবার, এবং যে কোনও সমস্যার জন্য, এই অ্যালগরিদমগুলির মধ্যে একটি অন্যদের তুলনায় বেশি উপযুক্ত হতে পারে৷ গেমটির নাম হল কীভাবে আপনার সমস্যার জন্য সঠিক অ্যালগরিদমটি বেছে নেওয়া যায়৷ আমাদের পদ্ধতিতে, আমরা এই পছন্দটিকে স্বয়ংক্রিয় করি,” বলেছেন আজিজান৷
তাদের কন্ট্রোল সিস্টেমে, গবেষকরা এমন ফাংশন প্রতিস্থাপন করেছেন যেটিতে সম্ভাব্য ব্যাঘাতের কিছু কাঠামো রয়েছে, একটি নিউরাল নেটওয়ার্ক মডেলের সাথে যা ডেটা থেকে তাদের ভবিষ্যদ্বাণী করতে শেখে। এইভাবে, এই ড্রোনটির মুখোমুখি হতে পারে এমন বাতাসের গতির একটি অগ্রাধিকার কাঠামোর তাদের প্রয়োজন নেই।
তাদের পদ্ধতিটি স্বয়ংক্রিয়ভাবে সঠিক মিরর-ডিসেন্ট ফাংশন নির্বাচন করার জন্য একটি অ্যালগরিদম ব্যবহার করে ডেটা থেকে একটি নিউরাল নেটওয়ার্ক মডেল শেখার সময়, ব্যবহারকারীর ইতিমধ্যেই আদর্শ ফাংশন নির্বাচন করা আছে বলে অনুমান না করে। গবেষকরা এই অ্যালগরিদমকে বেছে নেওয়ার জন্য একাধিক টাস্ক দেন এবং এটি সেই কাজটি খুঁজে পায় যা হাতে থাকা সমস্যাটির জন্য সবচেয়ে উপযুক্ত।
“ট্র্যাকিং ত্রুটি কমানোর জন্য সঠিক অ্যালগরিদম পেতে সঠিক মিরর-ডিসেন্ট অপ্টিমাইজেশন তৈরি করার জন্য একটি ভাল দূরত্ব-ফলন ফাংশন নির্বাচন করা অত্যন্ত গুরুত্বপূর্ণ,” ট্যাং বলেছেন৷
মানিয়ে নিতে শেখা
যদিও ড্রোনের মুখোমুখি বাতাসের গতি প্রতিবার উড্ডয়নের সময় পরিবর্তিত হতে পারে, কন্ট্রোলারের নিউরাল নেটওয়ার্ক এবং মিরর ফাংশন অবশ্যই একই থাকতে হবে যাতে প্রতিবার তাদের পুনরায় গণনা করার প্রয়োজন না হয়।
তাদের নিয়ামককে আরও নমনীয় করতে, গবেষকরা মেটা-লার্নিং ব্যবহার করে, প্রশিক্ষণের সময় এটিকে বায়ু গতির পরিবারগুলির একটি পরিসর দেখিয়ে মানিয়ে নিতে শেখায়।
ট্যাং ব্যাখ্যা করেন, “আমাদের পদ্ধতিটি বিভিন্ন উদ্দেশ্যে কাজ করতে পারে কারণ, মেটা-লার্নিং ব্যবহার করে, আমরা দক্ষতার সাথে বিভিন্ন পরিস্থিতিতে ডেটা থেকে ভাগ করা উপস্থাপনা শিখতে পারি।”
অবশেষে, ব্যবহারকারী কন্ট্রোল সিস্টেমকে একটি টার্গেট ট্র্যাজেক্টোরি ফিড করে এবং এটি ক্রমাগতভাবে রিয়েল টাইমে পুনঃগণনা করে যে ড্রোনটিকে যতটা সম্ভব সেই ট্র্যাজেক্টোরির কাছাকাছি রাখার জন্য এটির সম্মুখীন হওয়া অনিশ্চিত ব্যাঘাতের সাথে সামঞ্জস্য করার জন্য কতটা থ্রাস্ট তৈরি করা উচিত।
উভয় সিমুলেশন এবং বাস্তব-বিশ্বের পরীক্ষা-নিরীক্ষায়, গবেষকরা দেখিয়েছেন যে তাদের পদ্ধতির ফলে তাদের পরীক্ষা করা প্রতিটি বাতাসের গতির সাথে বেসলাইন পদ্ধতির তুলনায় উল্লেখযোগ্যভাবে কম ট্র্যাজেক্টরি ট্র্যাকিং ত্রুটি হয়েছে।
“এমনকি যদি বাতাসের বিক্ষিপ্ততা প্রশিক্ষণের সময় পর্যবেক্ষণ করা তুলনায় অনেক বেশি শক্তিশালী হয়, আমাদের কৌশল দেখায় যে এটি এখনও সফলভাবে তাদের পরিচালনা করতে পারে,” বলেছেন আজিজান।
উপরন্তু, বাতাসের গতিবেগ বৃদ্ধির সাথে সাথে, বেসলাইনকে ছাড়িয়ে যাওয়া তাদের পদ্ধতির মার্জিন বৃদ্ধি পেয়েছে, পরামর্শ দেয় যে এটি চ্যালেঞ্জিং পরিবেশের সাথে খাপ খাইয়ে নিতে পারে।
দলটি এখন হার্ডওয়্যার পরীক্ষা-নিরীক্ষা চালাচ্ছে বাস্তব ড্রোনগুলিতে তাদের নিয়ন্ত্রণ ব্যবস্থা পরীক্ষা করার জন্য বিভিন্ন বায়ু পরিস্থিতি এবং অন্যান্য ঝামেলা সহ।
তারা তাদের পদ্ধতিটি প্রসারিত করতে চায় যাতে এটি একই সাথে একাধিক উত্স থেকে ঝামেলা পরিচালনা করতে পারে। উদাহরণস্বরূপ, বাতাসের গতি পরিবর্তনের ফলে ড্রোন দ্বারা বহন করা পার্সেলের ওজন ফ্লাইটে স্থানান্তরিত হতে পারে, বিশেষ করে যখন ড্রোনটি একটি স্লোশিং পেলোড বহন করে।
তারা ক্রমাগত শেখার অন্বেষণ করতে চায়, যাতে ড্রোনটি এখন পর্যন্ত দেখা ডেটাতে পুনরায় প্রশিক্ষণের প্রয়োজন ছাড়াই নতুন বিশৃঙ্খলার সাথে খাপ খাইয়ে নিতে পারে।
“নাভিদ এবং তার সহকর্মীরা একটি যুগান্তকারী কাজ তৈরি করেছেন যা অরৈখিক বৈশিষ্ট্য এবং ডেটা থেকে উপযুক্ত অপ্টিমাইজেশান আইন শেখার জন্য ঐতিহ্যগত অভিযোজিত নিয়ন্ত্রণের সাথে মেটা-লার্নিংকে একত্রিত করে৷ তাদের পদ্ধতির মূল চাবিকাঠি হল মিরর ডিসেন্ট কৌশলগুলির ব্যবহার যা সমস্যার অন্তর্নিহিত জ্যামিতিকে কাজে লাগায় এবং স্বয়ংক্রিয়ভাবে তা করে৷ তাদের অবদানগুলি অটোমাস সিস্টেমের জটিল কাজগুলিকে পরিচালনা করতে এবং অটোমেটিক সিস্টেমের গুরুত্বপূর্ণ কাজ করতে পারে৷ অনিশ্চিত পরিবেশ,” বলেছেন ইলেক্ট্রিক্যাল ইঞ্জিনিয়ারিং অ্যান্ড কম্পিউটিং এর মস এবং লিলিয়ান এস বোন প্রফেসর বাবাক হাসিবি বলেছেন। ক্যালটেকের গাণিতিক বিজ্ঞান, যারা এই কাজের সাথে জড়িত ছিল না।
এই গবেষণাটি ম্যাথওয়ার্কস, এমআইটি-আইবিএম ওয়াটসন এআই ল্যাব, এমআইটি-আমাজন সায়েন্স হাব এবং কম্পিউটিং ইনোভেশনের জন্য এমআইটি-গুগল প্রোগ্রাম দ্বারা আংশিকভাবে সমর্থিত ছিল।