গুগল আর্টিফিশিয়াল ইন্টেলিজেন্স 'আলফা গো জিরো' কীভাবে শিখতে হবে সবেমাত্র চাপ দেওয়া রিসেট

মনে রাখবেন (অস্পষ্টভাবে) আপনি কীভাবে হাঁটাচলা, কথা বলা, বাইক চালানো বা ড্রাইভ শিখলেন? এটি অগোছালো এবং ভুলগুলি পূর্ণ ছিল, তবে আপনি যে দক্ষতাগুলি শিখেছিলেন সেগুলি স্থায়ী ছিল। জীবিত সিস্টেমের বাইরে, 'বাস্তব জীবনের অভিজ্ঞতা' গ্রহণ এবং কৃত্রিম বুদ্ধিমত্তার জন্য স্টিকি, অভিযোজ্য আচরণগুলি বিকাশের জন্য শক্তিশালী পর্যাপ্ত অ্যালগরিদম গঠন করা চ্যালেঞ্জিং ছিল।

ঠিক আছে, আলফা গো জিরো সবেমাত্র এটি করেছে।

'এটি একটি ফাঁকা স্লেট থেকে শুরু হয়ে কেবল নিজের জন্য, কেবল স্ব-খেলায় এবং কোনও মানুষের জ্ঞান, বা কোনও মানব ডেটা, বা বৈশিষ্ট্য, বা উদাহরণ বা মানুষের হস্তক্ষেপ ছাড়াই চিত্রিত হয়। এটি প্রথম নীতিগুলি থেকে গোয়ের খেলা কীভাবে খেলবে তা আবিষ্কার করে, 'বলেছেন ডিপমাইন্ডের অধ্যাপক ডেভিড সিলভার।

এআই এর বিভিন্ন পুনরাবৃত্তি হয়েছে, প্রতিটি স্মার্ট এবং আগেরটির চেয়ে বেশি সক্ষম। পূর্ববর্তী সংস্করণে অ্যালগরিদমগুলির একগুচ্ছ পাশাপাশি পূর্বের গেমগুলির একটি বিশাল ডাটাবেস ব্যবহার করেছিল যা এটি জয়ের দিকে দেখিয়েছিল। এই পদ্ধতির ফলে ক্ষমতাসীন বিশ্ব চ্যাম্পিয়ন পেশাদার গো খেলোয়াড়ের পরাজয় ঘটল। জুজুতে, এআই লাইব্র্যাটাস সম্প্রতি বিশ্বের শীর্ষ পোকার খেলোয়াড়দের প্রায় 2 মিলিয়ন ডলার করে নিয়েছে, এছাড়াও মানব গেমের তথ্যের পরিবর্তে স্ব-খেলার মাধ্যমে শিখেছে।

রাজকুমারী এবং রে জে নেট ওয়ার্থ

এখন, আলফা গোয়ের সর্বশেষতম সংস্করণে কৃত্রিম বুদ্ধিমত্তার প্রোগ্রামটি শিখিয়ে দেওয়া হয়েছে নিজেই কীভাবে খেলবেন - কোনও মানবিক পটভূমি নেই।

নিজের বিরুদ্ধে মিলিয়ন মিলিয়ন গেম সিমুলেশন চালানো, এটি স্ক্র্যাচ থেকে - কীভাবে নিজেই বিশ্ব চ্যাম্পিয়ন সংস্করণটিকে পরাজিত করতে পারে তা শিখতে 40 দিন লেগেছিল। এটি সত্যিই গেম-চেঞ্জিং, কেবল গো-র জন্য নয়, কীভাবে নতুন জ্ঞান আবিষ্কার হয় for আপনার ডোমেন দক্ষতা কতটা নির্ভুল বা সম্পূর্ণ? সেখানে অনেক আরও আবিষ্কার করার জন্য, আলফা গো জিরোর সাথে শেখার এই আকর্ষণীয় পরীক্ষাটি আমাদের কী বলছে telling

ইউটিউব পোস্টে সিলভার জানিয়েছে, 'আলফা গো ধারণাটি মানুষের বাইরে যাওয়া এবং পরাভূত করা নয়, বরং বিজ্ঞান বলতে কী বোঝায় তা আবিষ্কার করা - একটি প্রোগ্রামের জন্য জ্ঞান কী তা নিজের কাছ থেকে শিখতে সক্ষম হতে হবে, 'সম্পর্কে ইউটিউব পোস্টে রূপা অনুসারে অর্জন.

আলফা গো জিরো ডিপ মাইন্ড দল এটিকে প্রথম-নীতি বলে, 'তাবুল রস' (ফাঁকা স্লেট) শেখা।

'যদি আপনি অর্জন করতে পারেন অলিখিত ফলক শেখা, আপনার কাছে এমন একটি এজেন্ট রয়েছে যা গো এর গেম থেকে অন্য যে কোনও ডোমেইনে প্রতিস্থাপন করা যেতে পারে এবং আপনি যে গেমের স্পেসিফিকেশনে এসেছেন, আপনি এমন একটি এলগোরিদম নিয়ে এসেছেন যা এটিকে যে কোনও জায়গায় প্রয়োগ করা যেতে পারে, 'তিনি বলেছেন । আপনি ধারণাটি প্রসারিত করার সময় এটি একটি উত্তেজক ধারণা। একটু চিন্তা করুন যে আমরা শক্তিশালী, শেখার অ্যালগরিদমগুলির একটি সেট সঙ্গে কী করতে পারি যা পদ্ধতিগতভাবে কঠিন সমস্যাগুলি মোকাবেলা করতে পারে এবং আমাদের সভ্যতার সম্মিলিত জ্ঞানের চেয়ে দ্রুত শিখতে পারে। । । কয়েক দশকে নয়।

মার্কাস মারিওটা কি জাতীয়তা

আপাতত, বড় কথাটি হ'ল, 'অ্যালগরিদমগুলি কম্পিউটার বা ডেটা উপলব্ধ than আমরা কীভাবে পরিচিত বিশ্বকে প্রসারিত করতে পারি এটির মধ্যে এটি একা গেম-চেঞ্জার। আলফা গো হার্ডওয়্যারে প্রায় 25 মিলিয়ন ডলার চালিয়ে যাওয়ার সময় - এটি ঠিক একটি লাইটওয়েট সিস্টেম নয় - আপনি জানেন যে এআই গুরুরা দীর্ঘদিন ধরে ক্লিনার, আরও ভাল ডেটা সেট তৈরিতে কাজ করে যাচ্ছেন। কৃত্রিম বুদ্ধিমত্তাকে সঠিকভাবে প্রশিক্ষণ দেওয়ার জন্য আজ অনেকগুলি বড় ডেটা সেট খুব গোলমাল - খারাপ ডেটা পূর্ণ - বিবেচিত হয়। এআই যদি ডেটা থেকে শিখতে থাকে এবং ডেটা খারাপ হয় তবে তা শিখবে না। বিরাট সমস্যা.

আপনার যদি পরিষ্কার ডেটা না প্রয়োজন, তবে কেবল অভিজ্ঞতা, এবং কৃত্রিম বুদ্ধি নিজেই প্রশিক্ষণ নিতে পারে?

এটি আলফা গো জিরোর আকর্ষণীয় অর্জন। যদিও এটি গেমসের কুলুঙ্গি, নিয়ম-ভিত্তিক বিশ্বে রয়েছে, শারীরিক নিয়ম থেকে কাজ করে প্রতিটি শিল্পে এর বড় প্রভাব রয়েছে - চিন্তা করুন রসায়ন, ট্র্যাফিক, জীববিজ্ঞান, ফার্মাকোলজি, ভ্রমণ, রসদ এবং উত্পাদন। যদি আমরা বিধিগুলি এত নমনীয়ভাবে ডিজাইন করতে পারি যে তারা বিস্তৃত অভিজ্ঞতা থেকে কাজ করতে পারে, এবং এমন দিকনির্দেশক যে তারা সর্বদা শক্তিশালী দক্ষতা তৈরি করে - যেমন আলফা গো জিরো - তবে কৃত্রিম বুদ্ধিমত্তা অর্জন করা সম্ভব যা সিস্টেমে মাস্টারমাইন্ডস। এই সিস্টেমগুলির বাইরে কোনও ডেটা প্রয়োজন হবে না, ডেটা পরিষ্কার করার কোনও সমস্যা নেই এবং হিউম্যান-ইন-দ্য লুপের ধীরগতির প্রয়োজন নেই। আংশিক কারণেই গুগলের মূল সংস্থা, বর্ণমালা কৃত্রিম বুদ্ধিমত্তার উপর এই সংস্থাকে বাজি ধরেছে এবং দ্রুত হারে কৃত্রিম বুদ্ধিমত্তায় বিনিয়োগ করছে। (অ্যামাজনও তার সর্বশেষ এআই অধিগ্রহণের দেহাবলবের মতো কৃত্রিম বুদ্ধিমত্তায় বিনিয়োগ করছে))

ট্রে ব্রুকস এবং তার ভাই

ডিপ মাইন্ডের অধ্যাপক ডেভিড সিলভার বলেছেন, 'আমরা একটি প্রোগ্রামকে একটি উচ্চ-স্তরের পারফরম্যান্স অর্জন করতে দেখেছি ... এর অর্থ হওয়া উচিত এখন আমরা মানবতার জন্য কিছু চ্যালেঞ্জিং ও প্রভাবশালী সমস্যা মোকাবেলা করতে পারি' '

এই পোস্টে এটি স্পষ্ট করে আপডেট করা হয়েছে যে সম্প্রতি এআই লাইব্র্যাটাস শীর্ষ পোকার খেলোয়াড়দের এমন কৌশল ব্যবহার করে পরাজিত করেছে যা মানব-প্রবেশ করা ডেটার চেয়ে স্ব-খেলায় জড়িত।