استارتاپ چینی Moonshot AI مدل جدید خود با نام Kimi K2 Thinking را معرفی کرد که در بنچمارکهای مهم استدلال و کدنویسی عملکردی بالاتر از مدلهای اختصاصی و پولی جهانی از جمله GPT-5 و Claude Sonnet 4.5 داشته است و رکوردهای تازهای به ثبت رسانده است.
نورنیوز-گروه بین الملل: استارتاپ چینی Moonshot AI به تازگی از مدل هوش مصنوعی جدید خود با نام Kimi K2 Thinking رونمایی کرده است. این مدل نهتنها رقبای متنباز، بلکه مدلهای اختصاصی و تجاری پیشرفته مانند GPT-5 و Claude Sonnet 4.5 را نیز در آزمونهای مختلف پشت سر گذاشته است.
براساس دادههای منتشرشده توسط Moonshot AI، مدل Kimi K2 Thinking در بنچمارک BrowseComp، که عملکرد مدلها در جستجوی وب و انجام وظایف ایجنتی را میسنجد، با کسب امتیاز ۶۰.۲ درصد رکوردی جدید ثبت کرده است. این امتیاز بهطور چشمگیری بالاتر از GPT-5 با ۵۴.۹ درصد و Claude Sonnet 4.5 با ۲۴.۱ درصد قرار دارد.
علاوه بر این، Kimi K2 Thinking در آزمون استدلال HLE با کسب امتیاز ۴۴.۹ درصد یک رکورد تازه به ثبت رسانده است. در زمینه برنامهنویسی نیز این مدل در بنچمارک SWE-Bench Verified با امتیاز ۷۱.۳ درصد بالاتر از مدلهای رقیب جهانی قرار گرفته است.
Moonshot AI اعلام کرده است که هدف از توسعه Kimi K2 Thinking، ارائه مدلی است که هم در زمینه استدلال پیچیده و هم در کدنویسی پیشرفته بتواند بهطور قابل توجهی از مدلهای موجود پیشی بگیرد. کارشناسان معتقدند این موفقیت میتواند موقعیت چین در رقابت جهانی هوش مصنوعی را تقویت کند و نشاندهنده پیشرفت چشمگیر فناوری در استارتاپهای آسیایی است.