ylliX - Online Advertising Network

Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost

Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Chinese AI startup DeepSeek, known for challenging leading AI vendors with open-source technologies, just dropped another bombshell: a new open reasoning LLM called DeepSeek-R1. Based on the recently introduced DeepSeek V3 mixture-of-experts model, DeepSeek-R1 matches the […]

DeepSeek-R1 reasoning models rival OpenAI in performance

DeepSeek has unveiled its first-generation DeepSeek-R1 and DeepSeek-R1-Zero models that are designed to tackle complex reasoning tasks. DeepSeek-R1-Zero is trained solely through large-scale reinforcement learning (RL) without relying on supervised fine-tuning (SFT) as a preliminary step. According to DeepSeek, this approach has led to the natural emergence of “numerous powerful and interesting reasoning behaviours,” including […]

DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch

Join our daily and weekly newsletters for the latest updates and exclusive content on industry-leading AI coverage. Learn More Chinese AI startup DeepSeek, known for challenging leading AI vendors with its innovative open-source technologies, today released a new ultra-large model: DeepSeek-V3. Available via Hugging Face under the company’s license agreement, the new model comes with […]

OpanAI ရဲ့ O1 လုပ်ဆောင်ချက်ထက်ကောင်းမွန်ခဲ့တဲ့ DeepSeek ရဲ့ R1-Lite-Preview AI Model

DeepSeek ဆိုတာကတော့ တရုတ်နိုင်ငံရဲ့  High-Flyer Capital Management ကနေထွက်ပေါ်လာတဲ့ High-performance open-source နည်းပညာကို အဓိကလေ့လာတဲ့ AI ကုမ္ပဏီခွဲတစ်ခုဖြစ်ပါတယ်။ DeepSeek အနေနဲ့ Reasoning-focused large language model (LLM) ဖြစ်တဲ့ R1-Lite-Preview ကို လက်ရှိမှာ အသုံးချနိုင်ဖို့ စမ်းသပ်နေကြပြီ ဖြစ်ပါတယ်။ တစ်ချို့စမ်းသပ်ချက်တွေမှာ R1-Lite-Preview ဟာ OpenAI ရဲ့ o1-preview Model နဲ့ လုပ်ဆောင်ချက်တူတူလုပ်ပေးနိုင်တာတွေရှိသလို၊ ပိုကောင်းတဲ့လုပ်ဆောင်ချက်တွေကို လုပ်နိုင်နေတာမျိုးကိုလည်း တွေ့ရပါတယ်။ ထူးခြားချက်အနေနဲ့ ၂၀၂၄ စက်တင်ဘာလ မှာစမ်းသပ်ခဲ့တဲ့ R1-Lite-Preview Model ဟာ “chain-of-thought” ဆိုတဲ့ ဆက်စပ်တွေးတောနိုင်စွမ်းကို ပြသပေးနိုင်ခဲ့ပြီး အသုံးပြုသူတွေပေးပို့လာတဲ့အချက်အလက်တွေ၊ မေးခွန်းတွေကို အဆင့်ဆင့်နဲ့ ဘာလို့ဒီလိုဖြစ်တယ်၊ ဘာကြောင့်ဒီလိုဖြစ်တယ်ဆိုတာမျိုးအထိ […]