জানুয়ারী মাসে, এই বছরের শুরুতে, আর্টিফিশিয়াল ইন্টেলিজেন্স স্টার্টআপ DeepSeek তাদের নতুন মডেল R1-এর মাধ্যমে দুটি যুগান্তকারী উদ্ভাবন প্রকাশ করে, যা নীরবে আর্টিফিশিয়াল ইন্টেলিজেন্সের অর্থনীতিকে নতুনভাবে সংজ্ঞায়িত করেছে। এই মডেলটি আগের মডেলের তুলনায় ১/৪০ খরচে শীর্ষস্থানীয় পারফরম্যান্স অর্জন করে। ডিসেম্বর ২০২৪ পর্যন্ত, DeepSeek-এর V3 বৃহৎ ভাষা মডেল প্রশিক্ষণের খরচ ৯০% এর বেশি কমিয়েছে।
DeepSeek-এর দুটি যুগান্তকারী উদ্ভাবন ব্যাপক মনোযোগ আকর্ষণ করেছে: প্রথমত, DeepSeek প্রকাশ করেছে যে AI মডেলগুলিকে তাদের যুক্তিবোধ প্রক্রিয়াগুলি বিস্তারিতভাবে ব্যাখ্যা করতে বললে - যা চেইন-অফ-থট প্রম্পটিং নামে পরিচিত - নির্ভুলতা এবং দক্ষতা বৃদ্ধি করে। দ্বিতীয়ত, DeepSeek তাদের নিজস্ব ডেটা সেট তৈরি করতে আর্টিফিশিয়াল ইন্টেলিজেন্স ব্যবহার করে, যা ডেটার ম্যানুয়াল লেবেলিং থেকে সম্পূর্ণ স্বাধীন। যদিও এমন কিছু যুক্তি রয়েছে যে DeepSeek-এর দাবি অনুযায়ী এটি ততটা সস্তা নয়, তবে এই যুগান্তকারী উদ্ভাবনগুলি অবশ্যই AI অর্থনীতির একটি নতুন দিগন্ত উন্মোচন করেছে।
আর্টিফিশিয়াল ইন্টেলিজেন্সের ব্যয় কাঠামো নাটকীয়ভাবে পরিবর্তিত হচ্ছে। কর্মক্ষমতার প্রতিটি ডলার বৃদ্ধি স্টার্ট-আপ, এন্টারপ্রাইজ অ্যাপ্লিকেশন এবং অবকাঠামো বিনিয়োগের উপর গভীর প্রভাব ফেলেছে। এই পরিবর্তন বাজারের শক্তিকে উল্টে দিতে পারে, যা শেষ পর্যন্ত চটপটে স্টার্টআপগুলিকে স্বল্প মেয়াদে প্রযুক্তিগত জায়ান্টদের সাথে তাল মেলাতে সাহায্য করবে এবং একই সাথে মুনাফার মার্জিন বাড়িয়ে দেবে।
ইতিমধ্যে প্রযুক্তিগত জায়ান্টরা AI অবকাঠামো উন্নয়নে ১০০ বিলিয়ন ডলারের বেশি বিনিয়োগ করেছে এবং এটি ক্রমাগত বাড়ছে। এখন তাদের বিবেচনা করতে হবে কীভাবে এই বিশাল বিনিয়োগের উপর রিটার্ন তৈরি করা যায় এবং আরও চটপটে, ছোট বাজারের প্রতিযোগীদের বিরুদ্ধে প্রান্ত বজায় রাখা যায়। দ্রুত পরিবর্তনশীল পরিবেশে, প্রযুক্তিগত জায়ান্ট এবং স্টার্ট-আপ উভয়ই একটি স্পষ্ট সংকেতের মুখোমুখি হচ্ছে: দ্রুত প্রযুক্তিগত অগ্রগতির সুযোগ নিন, অথবা নির্মূল হয়ে যান।
DeepSeek-এর উত্থানের আগে, স্টার্ট-আপগুলি প্রযুক্তিগত জায়ান্টদের অবকাঠামো ব্যয়ের সাথে প্রতিদ্বন্দ্বিতা করতে সংগ্রাম করত, যারা প্রতি ত্রৈমাসিকে বিশাল ডেটা সেন্টার তৈরি করতে বিলিয়ন বিলিয়ন ডলার ঢেলেছিল এবং আর্টিফিশিয়াল ইন্টেলিজেন্স প্রযুক্তির অগ্রগতি থেকে বিশাল সুবিধা অর্জন করেছিল। এই জায়ান্টদের কেবল বিশাল ডেটা সংস্থানই নেই, বরং তারা প্রচুর সংখ্যক ডক্টরাল প্রতিভা সংগ্রহ করে এবং অ্যালগরিদমের অগ্রগতিও তাদের শক্তিশালী প্রযুক্তিগত শক্তির উপর নির্ভর করে। এছাড়াও, দীর্ঘ-প্রতিষ্ঠিত বিতরণ নেটওয়ার্কগুলি তাদের বিদ্যমান গ্রাহকদের কাছে দ্রুত পণ্য সরানোর অনুমতি দেয় এবং প্রতিক্রিয়া লুপের মাধ্যমে প্রযুক্তিগত অগ্রগতিকে ত্বরান্বিত করে।
তবে, বর্তমানে স্টার্টআপগুলি প্রযুক্তিগত জায়ান্টদের সাথে প্রতিযোগিতা করার জন্য যথেষ্ট বড় হয়েছে। শুধুমাত্র ২০২৫ সালের মধ্যে, মডেল প্রশিক্ষণের খরচ ৯৫% কমে যাবে, যা প্রযুক্তিগত জায়ান্টদের অবকাঠামোগত সুবিধা উল্লেখযোগ্যভাবে হ্রাস করবে। গত তিন বছরে যুক্তিবোধের খরচ প্রায় এক হাজার গুণ কমেছে এবং ভবিষ্যতে আরও কমার সম্ভাবনা রয়েছে। অ্যালগরিদমিক সুবিধার সময়কাল ৪৫ থেকে ১০০ দিনে হ্রাস করা হয়েছে এবং এটি হ্রাস অব্যাহত থাকতে পারে।
যখন প্রশিক্ষণের খরচ আর মূল বাধা থাকবে না, তখন ইনফারেন্স পারফরম্যান্স (অর্থাৎ, রিয়েল-টাইম অ্যাপ্লিকেশনগুলিতে AI মডেলগুলি কতটা ভালো পারফর্ম করে) একটি নতুন কেন্দ্রবিন্দু হয়ে উঠবে। আমরা একটি নতুন পর্যায়ে প্রবেশ করছি: ছোট, সস্তা মডেল যা বৃহত্তর মডেলগুলির সাথে তুলনীয় ক্ষমতা প্রদান করে এবং নিম্ন পারফরম্যান্সের GPU-তে চলতে পারে, যা পুরনো GPU-এর জীবনকাল বাড়িয়ে তোলে। যদি স্মার্ট AI পণ্যগুলি খুব কম খরচে সরবরাহ করা যায়, তাহলে স্টার্টআপগুলির অবশেষে প্রযুক্তিগত জায়ান্টদের ছাড়িয়ে যাওয়ার এবং একই সাথে মুনাফা বাড়ানোর সুযোগ রয়েছে।
দক্ষ জনশক্তি বরাদ্দ আরও চ্যালেঞ্জারের সুবিধা বাড়ায়। একটি প্রতিযোগিতামূলক AI দল তৈরি করার জন্য আর বিপুল সংখ্যক পিএইচডি-স্তরের প্রতিভা নিয়োগের প্রয়োজন নেই, স্টার্টআপগুলি প্রযুক্তিগত জায়ান্টদের তুলনায় অনেক কম খরচে মডেল তৈরি, অপটিমাইজ এবং বিতরণ করতে পারে। এবং, যেহেতু তারা মূলত অ্যাপ্লিকেশন স্তরে মনোনিবেশিত, তাই চ্যালেঞ্জাররা একই উপায়ে উচ্চ মুনাফার মার্জিন উপভোগ করতে সক্ষম হয়, যেমনিভাবে ক্লাউড স্টার্টআপগুলি ১৫ বছর আগে ইউনিট অর্থনীতি উন্নত করে সুবিধা অর্জন করেছিল।
এই প্রবণতা কেবল স্টার্টআপগুলির জন্যই ভালো নয়। এটি Nvidia-এর মতো কোম্পানিগুলির জন্য আরও বেশি ঝুঁকি তৈরি করে। DeepSeek-এর ঘোষণার পর, Nvidia-এর শেয়ারের দাম ১২% কমেছে, যদিও এটি পরে পুনরুদ্ধার করেছে। চিপ প্রস্তুতকারকদের জন্য ঝুঁকি বেড়েছে কারণ চাহিদা প্রশিক্ষণ-কেন্দ্রিক হার্ডওয়্যার থেকে আরও দক্ষ ইনফারেন্স সমাধানে স্থানান্তরিত হচ্ছে। গ্রাহক-গ্রেডের নিউরাল প্রসেসিং ইউনিট (NPU)-এর উত্থান এই পরিবর্তনকে ত্বরান্বিত করতে পারে, যা AI মডেলগুলিকে স্মার্টফোন এবং ল্যাপটপের মতো ডিভাইসে স্থানীয়ভাবে চালানোর অনুমতি দেয়।
চ্যালেঞ্জারদের জন্য যা ভালো, তা প্রযুক্তিগত জায়ান্টদের জন্য খারাপ। AI জায়ান্টরা প্রায় সহজাতভাবে DeepSeek-এর আধিপত্যকে জাতীয় নিরাপত্তা প্রভাবের সাথে যুক্ত করেছে, একই ধরনের প্রযুক্তির বিকাশের জন্য সমর্থন আদায়ের চেষ্টা করছে, এই সত্যকে উপেক্ষা করে যে স্ট্যানফোর্ড বিশ্ববিদ্যালয় সহ মার্কিন গবেষকরা DeepSeek-এর প্রযুক্তিকে প্রতিলিপি করতে এবং এমনকি ছাড়িয়ে যেতে সক্ষম হয়েছেন। ভবিষ্যতে, ডেটা অবকাঠামো প্রকল্পে বিশাল পরিমাণ অর্থ বিনিয়োগকারী কোম্পানিগুলি জিজ্ঞাসা করতে পারে: AI মডেল গবেষণা এবং উন্নয়নে এত বিশাল ব্যয় কি অপচয় হয়েছে? যদি সস্তা প্রযুক্তি ব্যয়বহুল প্রযুক্তির মতোই ভালো কাজ করে, তাহলে এত টাকা খরচ করার কী দরকার?
ঐতিহাসিক প্রবণতাগুলি ইঙ্গিত দেয় যে বেশিরভাগ AI অগ্রগতি প্রকৃতপক্ষে স্কেলে অতিরিক্ত মূলধন বিনিয়োগের উপর নির্ভর করেছে। ট্রান্সফরমার আর্কিটেকচার সফল হয়েছিল অতিরিক্ত প্রশিক্ষণের কারণে, যা সেই সময়ে অ্যালগরিদমিকভাবে সর্বোত্তম হিসাবে বিবেচিত হওয়ার চেয়ে বেশি ছিল। নতুন প্রযুক্তিগত অগ্রগতি প্রমাণ করছে যে আমরা কম খরচে একই পারফরম্যান্স অর্জন করতে পারি। যদিও DeepSeek-এর মতো দক্ষ সমাধানগুলি উল্লেখযোগ্যভাবে দক্ষতা উন্নত করেছে, তবুও, হাইপারস্কেল ক্লাউড প্রদানকারীদের সম্প্রসারণের জন্য এখনও বৃহত্তর ডেটা সেন্টার প্রয়োজন এবং ক্রমবর্ধমান ইনফারেন্স খরচ বহন করতে হবে।
তবে, প্রযুক্তিগত জায়ান্টরা বসে নেই। আমরা ইতিমধ্যে DeepSeek-এর সাফল্যের জন্য একটি অস্ত্র প্রতিযোগিতা দেখছি, যেখানে Google-এর Gemini মডেল, Microsoft-এর Azure AI Foundry এবং Meta-এর ওপেন সোর্স LLaMA সবাই আধিপত্যের জন্য প্রতিদ্বন্দ্বিতা করছে। ওপেন সোর্স মডেলগুলি একটি গুরুত্বপূর্ণ ভূমিকা পালন করতে পারে। মেটা-র সিইও মার্ক জাকারবার্গ ব্যক্তিগতকৃত AI-এর গুরুত্বের উপর জোর দিয়েছেন - অর্থাৎ, পৃথক ব্যবহারকারীদের চাহিদা, সংস্কৃতি এবং পছন্দ অনুসারে তৈরি মডেল। এই দৃষ্টিভঙ্গি AI বিকাশের বৃহত্তর প্রবণতার সাথে সঙ্গতিপূর্ণ: ছোট, আরও বিশেষায়িত মডেল যা বিশাল ক্লাউড অবকাঠামোর প্রয়োজন ছাড়াই উচ্চ পারফরম্যান্স সরবরাহ করতে সক্ষম।
একই সময়ে, ওপেন সোর্স এবং ক্লোজড সোর্স জায়ান্টদের ভিন্ন ভিন্ন লক্ষ্য রয়েছে, যা আরও চ্যালেঞ্জারের সুবিধা বাড়ায়। মেটা-র মতো কোম্পানিগুলির তৈরি করা ওপেন সোর্স মডেলগুলি ইকোসিস্টেম জুড়ে প্রতিযোগিতা করবে এবং খরচ কমাবে, যেখানে ক্লোজড সোর্স মডেলগুলি আরও ভালো প্রযুক্তির মাধ্যমে উচ্চ ফি চার্জ করার চেষ্টা করে। স্টার্টআপগুলি প্রতিটি ব্যবহারের জন্য সেরা মূল্য/পারফরম্যান্স অনুপাত অর্জনের জন্য দুটি শিবিরের মধ্যে প্রতিযোগিতা ব্যবহার করতে পারে, একই সাথে মুনাফার মার্জিন বাড়িয়ে।
ব্যবসার আকার নির্বিশেষে, বার্তাটি স্পষ্ট: তাদের জন্য উপলব্ধ নির্দিষ্ট সুবিধাগুলি - বাজারের গতিশীলতা, কম্পিউটিং শক্তি এবং প্রতিভা - দ্রুত কাজে লাগান অথবা ব্যর্থতার সম্মুখীন হন। প্রযুক্তিগত অগ্রগতির চক্র ছোট হচ্ছে, নতুন পারফরম্যান্সের মান নির্ধারণ করতে যে মাস বা এমনকি বছর লাগত, DeepSeek-এর প্রযুক্তিগত সাফল্যের কারণে এখন মাত্র ৪১ দিন লাগতে পারে। উদ্ভাবন অভূতপূর্ব হারে এগিয়ে চলেছে এবং ফল্ট-টলারেন্সের স্থান দ্রুত সংকুচিত হচ্ছে।