Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Chinese AI startup DeepSeek, known for challenging leading AI vendors with open-source technologies, just dropped another bombshell: a new open reasoning LLM called DeepSeek-R1. Based on the recently introduced DeepSeek V3 mixture-of-experts model, DeepSeek-R1 matches the […]
DeepSeek has unveiled its first-generation DeepSeek-R1 and DeepSeek-R1-Zero models that are designed to tackle complex reasoning tasks. DeepSeek-R1-Zero is trained solely through large-scale reinforcement learning (RL) without relying on supervised fine-tuning (SFT) as a preliminary step. According to DeepSeek, this approach has led to the natural emergence of “numerous powerful and interesting reasoning behaviours,” including […]
Chinese start-up DeepSeek has emerged as “the biggest dark horse” in the open-source large language model (LLM) arena in 2025, just days after the firm made waves in the global artificial intelligence (AI) community with its latest release. That assessment came from Jim Fan, a senior research scientist at Nvidia and lead of its AI […]
Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Chinese AI startup DeepSeek, known for challenging leading AI vendors with its innovative open-source technologies, today released a new ultra-large model: DeepSeek-V3. Available via Hugging Face under the company’s license agreement, the new model comes with […]
DeepSeek ဆိုတာကတော့ တရုတ်နိုင်ငံရဲ့ High-Flyer Capital Management ကနေထွက်ပေါ်လာတဲ့ High-performance open-source နည်းပညာကို အဓိကလေ့လာတဲ့ AI ကုမ္ပဏီခွဲတစ်ခုဖြစ်ပါတယ်။ DeepSeek အနေနဲ့ Reasoning-focused large language model (LLM) ဖြစ်တဲ့ R1-Lite-Preview ကို လက်ရှိမှာ အသုံးချနိုင်ဖို့ စမ်းသပ်နေကြပြီ ဖြစ်ပါတယ်။ တစ်ချို့စမ်းသပ်ချက်တွေမှာ R1-Lite-Preview ဟာ OpenAI ရဲ့ o1-preview Model နဲ့ လုပ်ဆောင်ချက်တူတူလုပ်ပေးနိုင်တာတွေရှိသလို၊ ပိုကောင်းတဲ့လုပ်ဆောင်ချက်တွေကို လုပ်နိုင်နေတာမျိုးကိုလည်း တွေ့ရပါတယ်။ ထူးခြားချက်အနေနဲ့ ၂၀၂၄ စက်တင်ဘာလ မှာစမ်းသပ်ခဲ့တဲ့ R1-Lite-Preview Model ဟာ “chain-of-thought” ဆိုတဲ့ ဆက်စပ်တွေးတောနိုင်စွမ်းကို ပြသပေးနိုင်ခဲ့ပြီး အသုံးပြုသူတွေပေးပို့လာတဲ့အချက်အလက်တွေ၊ မေးခွန်းတွေကို အဆင့်ဆင့်နဲ့ ဘာလို့ဒီလိုဖြစ်တယ်၊ ဘာကြောင့်ဒီလိုဖြစ်တယ်ဆိုတာမျိုးအထိ […]