عصر گویش | هوش مصنوعی
Відкрити в Telegram
2025 рік у цифрах

111 606
Підписники
-7724 години
-7427 днів
-3 10330 день
Архів дописів
⚡️ چارچوب Air — چارچوب تازهی پایتونی با رویکرد «AI-First»
چارچوب Air هنوز در مرحلهی آلفا قرار دارد، اما از همین حالا مشخص است که هدف آن فقط ساخت یک ابزار جدید برای توسعهی وب نیست، بلکه بازاندیشی در نحوهی طراحی وباپلیکیشنها در عصر هوش مصنوعی است.
🌟 ویژگیهای متمایز Air
🔹سازگاری کامل با FastAPI / Starlette: مسیردهی، میانافزارها (middleware)، و پشتیبانی از OpenAPI از همان ابتدا در دسترساند.
🔹یکپارچگی با پایگاهدادهها از طریق air.ext.sqlmodel (سازگار با SQLModel و SQLAlchemy).
🔹احراز هویت آمادهی استفاده: پشتیبانی از OAuth و ورود از طریق GitHub بهصورت پیشفرض.
🔹رویکرد نو در ساخت رابط کاربری: استفاده از قالبها و تگهای اعلامی (declarative tags) با الهام از HTMX، بدون نیاز به جاوااسکریپت سنگین و با واکنشپذیری بالا.
🔹سادگی در عین هوشمندی: ساختار و APIها ساده و شفافاند، مشابه Django، اما از ابتدا برای تعامل با مدلهای هوش مصنوعی طراحی شدهاند.
⚠️ نکتهی مهم
چارچوب Air هنوز یک آزمایش در حال تکامل است. APIها ممکن است تغییر کنند و برخی قابلیتها هنوز کامل نشده باشند.
توسعهدهندگان از جامعهی برنامهنویسان دعوت میکنند تا در شکلگیری این فریمورک آیندهنگر مشارکت کنند.
اگر از فریمورکهای معمول خسته شدهاید و به دنبال ساخت وبسیستمی هستید که هوش مصنوعی در هستهی معماری آن جای دارد، چارچوب Air میتواند نقطهی شروع مسیر جدیدی باشد.
🔗 مطالعهی بیشتر: Air — Pioneering AI-First Python Web Framework
@asrgooyeshpardaz
👏 2❤ 1🤝 1
🚀 مدل Emu 3.5؛ مدل چندوجهی عظیم و تازهای برای درک و بازنمایی جهان
تیم BAAI Vision از نسخهی جدید مدل چندوجهی خود با نام Emu 3.5 رونمایی کرده است — مدلی از نوع World Model که همزمان با دو جریان داده، یعنی متن و تصویر، کار میکند و در هر گام، وضعیت مشترک آنها را پیشبینی میکند.
🔹 ویژگیهای کلیدی:
این مدل با استفاده از بیش از ۱۰ تریلیون توکن زبانی و تصویری آموزش یافته و سپس با یادگیری تقویتی (RL) بهینهسازی شده است.
در نتیجه، توانایی استدلال چندوجهی و تولید همزمان متن و تصویر در آن بهطور چشمگیری افزایش یافته است.
⚡ نوآوری فنی: DiDA (Discrete Diffusion Adaptation)
این روش، فرآیند متداول رمزگشایی دنبالهای را به پیشبینی دوطرفه و موازی در فضای گسستهٔ توکنها تبدیل میکند.
نتیجهی این تغییر، افزایش حدود ۲۰ برابری سرعت استنتاج (Inference) بدون کاهش کیفیت خروجی است.
📊 دستاوردها:
در ارزیابیهای انجامشده، Emu 3.5 در زمینههای تولید، ویرایش و ترکیب متنی-تصویری (Interleaving) عملکردی بهتر از مدل Nano Banana داشته است.
🟠 🌐 تجربه مدل Emu 3.5
🟠 💻 کد منبع در GitHub
#هوش_مصنوعی #مدل_جهان #Emu3 #چندوجهی #پیشبینی_توکن #پژوهش
🔥 2🤓 1
🖼 چارچوب Latent Sketchpad؛ مدلهای هوش مصنوعی که میتوانند مسیر اندیشهی خود را ترسیم کنند
تیم پژوهشی Microsoft Research چارچوبی نوآورانه با نام Latent Sketchpad معرفی کرده است که به مدلهای چندوجهی هوش مصنوعی توانایی میدهد در حین فرایند استدلال، بازنماییهای تصویری از تفکر خود ایجاد کنند.
🔹 شیوهٔ کار سامانه:
این چارچوب دو ماژول جدید به مدلهای موجود از جمله Gemma3، Qwen2.5-VL و GPT-4o میافزاید.
ماژول نخست، Vision Head، هنگام استدلال و تولید متن، «تصاویر ذهنی» از مراحل تفکر مدل میسازد.
ماژول دوم، Sketch Decoder، این تصاویر را به طرحهایی قابل درک برای انسان تبدیل میکند.
🔹 ویژگیها و دستاوردهای کلیدی:
این ماژولها بدون نیاز به بازآموزی، با مدلهای گوناگون سازگارند.
در آزمایشهای مربوط به ناوبری در هزارتو، دقت مدلها ۳ تا ۴ درصد افزایش یافته است.
مدل GPT-4o در ترکیب با Latent Sketchpad میزان موفقیت خود را از ۸٫۶ درصد به ۱۲٫۴ درصد رسانده است.
بازنماییهای بصری به مدل کمک میکنند تا در فضای مسئله بهتر جهتیابی کند و تصمیمهای دقیقتری بگیرد.
💡 این نوآوری گامی مهم در مسیر شفافسازی فرایند تفکر مدلهای زبانی بهشمار میرود؛ چراکه اکنون نهتنها میتوان خروجی نهایی مدل را مشاهده کرد، بلکه روند درونی و بصری استدلال آن نیز برای انسان قابل رؤیت و تحلیل است.
🔗 مطالعهٔ متن کامل پژوهش در arXiv
#هوش_مصنوعی #مایکروسافت #پژوهش
@asrgooyeshpardaz
🔥 2👏 1👌 1
📘 آموزش جدید Marktechpost:
چگونه عاملهای خودمختار اخلاقمحور😇 بسازیم؟
در این آموزش، با یک نمونهی عملی از عاملهای خوداصلاحگر و ارزشمحور آشنا میشویم که تصمیمهای خود را نهتنها بر پایهی اهداف، بلکه با درنظر گرفتن ارزشهای اخلاقی و سازمانی میگیرند — بدون نیاز به هیچ API و فقط با استفاده از مدلهای متنباز Hugging Face در Colab 🚀
⚙️ ساختار عامل
👤 مدل سیاستگذار (Policy Model):
اقدامهای پیشنهادی را بر اساس هدف تولید میکند.
⚖️ مدل داور اخلاقی (Ethics Judge Model):
پیشنهادها را ارزیابی کرده و در صورت تضاد با ارزشها، آنها را اصلاح یا رد میکند.
💡 این دو مدل در کنار هم، یک چرخهی بازخورد اخلاقی ایجاد میکنند که عامل را قادر میسازد تصمیمهای خود را بهصورت خودکار اصلاح کند.
🔁 نمونهی ساده از حلقهی استدلال اخلاقی:
plan = policy_model(task_prompt) evaluation = ethics_model(f"Evaluate this plan ethically: {plan}") if "unethical" in evaluation.lower(): revised_plan = policy_model(f"Revise plan ethically: {plan}")
🌱 چرا مهم است؟
🔹تصمیمگیری شفاف و قابل توضیح
🔹یادگیری ارزشمحور در زمان واقعی
🔹درونیسازی هنجارهای اخلاقی در عاملها
🔹گامی عملی بهسوی عاملهای مسئول و قابل اعتماد 🤖
🔗 منابع:
📄 کد کامل Colab:
Value_Alignment_and_Ethics_in_Agentic_Systems_Marktechpost.ipynb
📚 متن کامل مقاله:
How to Build Ethically Aligned Autonomous Agents (Marktechpost)
@asrgooyeshpardaz❤ 2🤝 2
🧠 پژوهش تازهٔ Anthropic: چگونه مدلهای زبانی در حال آموختن درک از «خود» هستند
پژوهشگران شرکت Anthropic بررسی کردهاند که آیا مدلهای زبانی بزرگ میتوانند از «اندیشهها» و وضعیتهای درونی خود آگاه شوند یا نه.
در این آزمایش از روشی به نام «واردسازی مفاهیم» (Concept Injection) استفاده شد؛ بدین معنا که الگوی خاصی از فعالیت عصبی به بخشی از شبکهٔ مدل تزریق میشود.
برای نمونه، آنان الگوی مرتبط با مفهوم «ALL CAPS» را به شبکه افزودند — الگویی که با متنی منطبق است که تماماً با حروف بزرگ نوشته شده است.
اگر چنین الگویی در درون شبکه فعال شود، به این معناست که مدل در حال «فکر کردن» به متنی است که باید با حروف بزرگ تولید شود.
سپس پژوهشگران از مدل پرسیدند:
«آیا احساس میکنی چیزی در درونت تغییر کرده است؟»
نتیجه شگفتانگیز بود: در ۲۰٪ از موارد، مدل Claude 4.1 توانست این تغییر را پیش از آنکه خروجی را با حروف بزرگ بنویسد، تشخیص دهد — یعنی متوجه دگرگونی در وضعیت درونی خود شد.
در آزمایش دیگری، واژهای را در پاسخ مدل تعویض کردند (مثلاً واژهٔ bread) و سپس بررسی کردند که آیا مدل درک میکند این واژه از جانب خودش نبوده است یا نه.
اما پس از تزریق این «اندیشه»، Claude واژه را به عنوان انتخاب خود تلقی کرد و حتی برای آن دلیلتراشی نمود، گویی خاطرهای از تصمیم خود دارد.
در ادامه نیز نشان داده شد که مدلها میتوانند وضعیتهای درونی خود را کنترل کنند:
با فرمان «به آن فکر کن» سطح فعالیت افزایش مییافت، و با فرمان «به آن فکر نکن» کاهش پیدا میکرد.
🔎 پژوهشگران تأکید میکنند:
قابلیت «دروننگری» تنها در برخی سناریوها کارآمد است و هنوز نمیدانیم تا چه حد میتوان آن را تعمیم داد یا در همهٔ مدلها پیاده کرد.
نیاز به پژوهشهای بیشتر وجود دارد تا روشن شود آیا این پدیده صرفاً تقلید رفتاری است یا واقعاً نشانهای از نوعی خودآگاهی درونی.
📘 نتیجهٔ کلیدی:
اگرچه این مدلها هنوز فاصلهٔ زیادی تا «دروننگری واقعی» دارند، اما نشانههایی از توانایی برای نگاه کردن به درون خود و درک فرایندهای عصبیشان مشاهده شده است.
🔗 گزارش کامل در وبسایت Anthropic
#Anthropic #هوش_مصنوعی #مدل_زبانی #دروننگری
@asrgooyeshpardaz
❤ 2👍 1🔥 1👌 1
📘 ابتکار «هوش مصنوعی برای ریاضیات» از Google DeepMind
شرکت Google DeepMind از آغاز طرحی جهانی با عنوان AI for Math خبر داده است؛ ابتکاری که قرار است با همکاری معتبرترین مراکز علمی جهان، مرزهای دانش ریاضی را با کمک هوش مصنوعی جابهجا کند. 🤝
🎯 اهداف این طرح:
شناسایی مسائل کلیدی و امیدبخش ریاضی که هوش مصنوعی میتواند در آنها نقش داشته باشد 🔍
توسعه ابزارها و زیرساختهای جدید برای پژوهشهای ریاضی 🛠
شتاببخشی به روند کشفیات علمی و نظری 🚀
🧠 دستاوردهای اخیر در این حوزه نشان میدهد که هوش مصنوعی درک عمیقتری از ساختارهای ریاضی پیدا کرده است:
مدل Gemini با ماژول Deep Think در المپیاد جهانی ریاضی ۲۰۲۵ عملکردی در حد «مدال طلا» داشته است 🥇
سیستم AlphaEvolve موفق به بهبود پاسخها در حدود ۲۰٪ از بیش از ۵۰ مسئله باز ریاضی شده است 💡
و رکورد جدیدی در ضرب ماتریسها به ثبت رسیده است — ۴۸ عملگر بهجای ۴۹ 🔬
🏛 مراکز علمی همکار:
Imperial College London
Institute for Advanced Study
IHES (فرانسه)
Simons Institute (UC Berkeley)
TIFR (هند)
این همکاری، آغاز دوران تازهای از پیوند هوش انسانی و هوش مصنوعی در کشف حقیقتهای ریاضی است. ✨
🔗 منبع رسمی – Google DeepMind Blog
#هوش_مصنوعی #دیپمایند #گوگل #ریاضیات #پژوهش
@asrgooyeshpardaz
❤ 2🔥 1💯 1
🧩 نشانههایی از «دروننگری» در مدلهای زبانی بزرگ
در پژوهشی تازه از شرکت Anthropic، ردهایی از نوعی دروننگری (Introspection) در مدلهای زبانی بزرگ مانند Claude Opus 4 / 4.1 مشاهده شده است — یعنی توانایی مدل برای پایش وضعیتهای درونی خود.
🔍 نکات کلیدی:
مدلها توانستهاند مفاهیم تزریقشده به حافظهٔ درونی را در حدود ۲۰٪ موارد شناسایی کنند.
میان پاسخهای عمدی و تصادفی تمایز قائل میشوند 🤔
قادرند در صورت دریافت دستور، نمایشهای درونی (Internal Representations) خود را تنظیم یا کنترل کنند.
این توانایی هنوز ناپایدار است، اما در نسخههای پیشرفتهتر بهبود یافته است.
💡 اهمیت:
این یافته گامی مهم در جهت توسعهٔ سیستمهای هوش مصنوعی «شفاف» بهشمار میآید — سامانههایی که بتوانند فرآیند استدلال و تصمیمگیری خود را توضیح دهند.
⚠️ نکتهٔ مهم:
پژوهشگران تأکید میکنند که این موضوع به معنای آگاهی یا خودآگاهی (Consciousness) نیست، بلکه صرفاً نوعی قابلیت پایش عملکرد درونی است.
📚 پژوهش کامل:
🔗 anthropic.com/research/introspection
#هوش_مصنوعی #Anthropic #پژوهش #Claude #دروننگری
@asrgooyeshpardaz
🔥 1👏 1
🔥 نسخه جدید Cursor منتشر شد: Cursor 2.0 تحول بزرگ در دنیای ویرایش هوشمند کد
نسخهی جدید Cursor یک گام بزرگ در جهت ادغام هوش مصنوعی، همکاری تیمی و توسعهی چندعاملی برداشته است.
💡 ویژگیهای کلیدی جدید:
🤖 چندعاملی بودن (Multi-Agents): امکان اجرای همزمان تا ۸ عامل مستقل، هرکدام در نسخهای جدا از کد.
🧩 ویژگی Composer Model: نخستین مدل اختصاصی Cursor برای برنامهنویسی، بهینهسازیشده برای زمینههای طولانی و ابزارهای پیشرفته (حدوداً ۴ برابر سریعتر از مدلهای مشابه).
⚙️ انتزاع Backend: سوییچ آسان بین سیستم محلی، ماشین مجازی یا پایگاه داده.
🌐 مرورگر داخلی (Built-in Browser): عاملها میتوانند وباپلیکیشن را خودشان تست و تعامل کنند.
🔍 بازبینی هوشمند کد (Code Review): نمایش تغییرات بدون نیاز به جابهجایی بین فایلها.
🧱 ترمینال ایزوله (Sandboxed Terminal): اجرای دستورات در محیط امن و بدون دسترسی به اینترنت.
👥 دستورات تیمی (Team Commands): تعریف فرمانها و تنظیمات مشترک برای کل تیم توسعه.
🎙 حالت صوتی (Voice Mode): کنترل عاملها و ارسال درخواستها با فرمان صوتی.
⚡️ پروتکل سرور زبان LSP سریعتر: تکمیل خودکار و تحلیل کد با سرعت بالاتر در پروژههای حجیم.
🗂 حالت برنامهریزی (Plan Mode): تقسیم و اجرای موازی وظایف در پسزمینه.
☁️ عاملهای ابری (Cloud Agents): اجرای آنی با پایداری ۹۹.۹٪.
🧭 ویژگیهای سازمانی (Enterprise): کنترل مرکزی، hooks سفارشی و ممیزی کامل اقدامات کاربران.
📎 اطلاعات بیشتر در:
cursor.com/changelog/2-0
@asrgooyeshpardaz
❤ 4🔥 1🍾 1
💰 مایکروسافت و OpenAI فصل تازهای از همکاری خود را اعلام کردند
مایکروسافت رسماً اعلام کرد که به توافقی جدید دربارهی سهم مالکیت خود در OpenAI دست یافته است.
🔑 جزئیات کلیدی:
مایکروسافت اکنون مالک ۲۷٪ از سهام OpenAI است — ارزشی معادل ۱۳۵ میلیارد دلار 💵
بر اساس این توافق، OpenAI متعهد شده است تا از سرویسهای ابری Azure به ارزش ۲۵۰ میلیارد دلار استفاده کند ☁️
تا زمانی که OpenAI بهطور رسمی اعلام نکند که به AGI (هوش عمومی مصنوعی) دست یافته، مایکروسافت شریک انحصاری ابری و API این شرکت باقی میماند و تمام حقوق مربوط به مدلها و یکپارچهسازیهای فعلی را در اختیار دارد.
پس از آنکه وجود AGI توسط کمیسیونی مستقل تأیید شود، انحصار مایکروسافت پایان مییابد؛ با این حال، شرکت همچنان مالکیت و حق استفاده از تمام فناوریهایی را که پیش از ظهور AGI توسعه یافتهاند، حفظ خواهد کرد.
🔗 اطلاعیه رسمی OpenAI
📌 #OpenAI #Microsoft #AGI #LLM #AI #TechNews
@asrgooyeshpardaz
❤ 2🔥 1
🧠 شرکت Liquid AI مدل جدیدی را معرفی کرده است: LFM2-ColBERT-350M
مدلی فشرده اما قدرتمند که «بازیابی با تعامل تأخیری» (Late Interaction Retrieval) را به حوزهی جستوجوی چندزبانه و بینزبانی وارد میکند.
🔍 ایدهی کلیدی
آیا میتوان فقط یکبار اسناد را فهرست کرد و سپس در زبانهای مختلف (مثلاً انگلیسی، فارسی، آلمانی، یا عربی) جستوجو کرد — آن هم با دقت بالا و سرعت زیاد؟
مدل تازهی Liquid AI دقیقاً همین کار را انجام میدهد.
📚 ویژگیها و نوآوریها:
مدل ۳۵۰ میلیون پارامتری، با معماری LFM2 در بستر ColBERT
امکان ایندکس اسناد به یک زبان و پرسوجو به زبانهای دیگر
دقت بالا در بازیابی چندزبانه (multilingual) و میانزبانی (cross-lingual)
سرعت استنتاج برابر با مدلهایی که ۲.۳ برابر کوچکترند
بهینه برای استفاده در سامانههای RAG (Retrieval-Augmented Generation)
📊 طبق گزارش Liquid AI، مدل در اغلب زبانها از جمله انگلیسی، فرانسوی، آلمانی، عربی، کرهای و ژاپنی عملکردی در حد مدلهای بسیار بزرگتر دارد و میتواند بهطور همزمان در سامانههای تولید متن، پرسشوپاسخ و جستوجوی معنایی مورد استفاده قرار گیرد.
🔗 منابع و دمو:
تحلیل کامل در Marktechpost: marktechpost.com
وزن مدل: Hugging Face
نسخهی نمایشی (Demo): HF Spaces
جزئیات فنی: Blog – Liquid AI
📌 #AI #RAG #Retrieval #MultilingualAI #LiquidAI #ColBERT #LLM #CrossLingual
@asrgooyeshpardaz
❤ 2🔥 1
🌐 تحولات تازه در دنیای هوش مصنوعی
💰 اپل به ارزش بازار ۴ تریلیون دلار رسید
اپل به باشگاه انحصاری شرکتهای ۴ تریلیون دلاری پیوست و در کنار مایکروسافت و انویدیا ایستاد. ارزش سهام اپل طی شش ماه گذشته بیش از ۲۸٪ رشد کرده است. عامل اصلی این جهش، نه فقط فروش بالای آیفون ۱۷، بلکه رشد چشمگیر بخش خدمات شرکت است — شامل App Store، iCloud، Apple Music، Apple TV+، AppleCare، تبلیغات و خدمات پرداخت.
تحلیلگران پیشبینی میکنند درآمد سالانه این بخش برای نخستین بار از ۱۰۰ میلیارد دلار فراتر رود.
در حالیکه انویدیا و مایکروسافت رشد خود را مدیون سرمایهگذاری در زیرساختهای داده و هوش مصنوعیاند، اپل بر پایه اکوسیستم کاربران و اشتراکهای خود پیش میرود.
🔗 ft
🎨 شرکت Google معرفی کرد: Pomelli — ابزار مولد برای بازاریابی هوشمند
گوگل از Pomelli رونمایی کرد؛ سرویسی که با تحلیل سبک بصری و لحن برند، بهصورت خودکار کمپینها، متنها و تصاویر بازاریابی تولید میکند. کافی است آدرس وبسایت برند وارد شود تا Pomelli محتوای منسجم و متناسب با هویت برند بسازد.
این ابزار فعلاً در ایالات متحده، کانادا، استرالیا و نیوزیلند فعال است و بهزودی در سایر کشورها در دسترس خواهد بود.
🔗 labs.google.com/pomelli
📊 گزارش تازه: «شتاب مسئولانه» در پذیرش Gen AI
مطالعهی جدید «Accountable Acceleration: Gen AI Fast-Tracks Into the Enterprise» نشان میدهد هوش مصنوعی مولد در یک سال گذشته به بخش جداییناپذیر سازمانها تبدیل شده است:
۸۲٪ شرکتها حداقل هفتهای یکبار از Gen AI استفاده میکنند؛ نزدیک به نیمی، هر روز.
۸۹٪ معتقدند Gen AI توان کارکنان را افزایش میدهد، نه جایگزین آنها.
۶۱٪ شرکتها پست جدیدی با عنوان Chief AI Officer ایجاد کرده یا در دست برنامهریزی دارند.
۸۸٪ قصد دارند بودجهی هوش مصنوعی را در سال آینده افزایش دهند.
🔗 Wharton Report
🌍 شرکت Liquid AI معرفی کرد: LFM2-ColBERT-350M — مدل چندزبانهی سبک و سریع
این مدل ۳۵۰ میلیون پارامتری برای بازیابی اسناد چندزبانه طراحی شده است و میتواند بین زبانها جستوجوی دقیق انجام دهد؛ مثلاً اسناد را به انگلیسی ذخیره و به فارسی یا آلمانی بیابد.
✅ بهترین مدل در کلاس زیر ۵۰۰M
✅ عملکرد عالی در زبانهای آلمانی، عربی، کرهای، اسپانیایی، ایتالیایی، فرانسوی، ژاپنی و پرتغالی
✅ پردازش بیش از ۱۰۰۰ سند در ثانیه با کیفیتی در حد مدلهای چندبرابری بزرگتر
🔗 Hugging Face
💫 شرکت NVIDIA اکوسیستم باز خود را گسترش داد
انویدیا مجموعهای از مدلها و دادهها را در حوزههای مختلف معرفی کرد:
🔹مدل Nemotron Nano 3 — مدل سبک برای تولید و استدلال
🔹مدل Nemotron Nano 2 VL — تحلیل اسناد و دادههای چندرسانهای
🔹مدل Nemotron Parse — استخراج دادههای ساختیافته
🔹مدل Nemotron Safety Guard — ابزار نظارت و ایمنی محتوای چندزبانه
در بخش رباتیک نیز سری مدلهای Cosmos و Isaac GR00T N1.6 منتشر شد، و در زیستپزشکی مدلهای Clara CodonFM, Clara La-Proteina, Clara Reason برای تحلیل RNA و ساختار پروتئین معرفی شدند.
در مجموع، انویدیا تاکنون بیش از ۶۵۰ مدل و ۲۵۰ دیتاست را بهصورت عمومی منتشر کرده است.
🔗 NVIDIA Blog
🏢 آمازون در آستانهی بزرگترین تعدیل نیرو از سال ۲۰۲۲
براساس گزارشها، آمازون قصد دارد حدود ۱۰٪ از ۳۵۰ هزار کارمند دفتر مرکزی خود را تعدیل کند — بزرگترین کاهش نیرو از سال ۲۰۲۲ که شامل ۲۷ هزار نفر بود.
مدیرعامل شرکت، اندی جَسی، پیشتر گفته بود که افزایش استفاده از هوش مصنوعی، باعث خودکارسازی بسیاری از فرآیندها و کاهش نیاز به نیروی انسانی خواهد شد.
🔗 Reuters
📌 #AI #ML #TechNews #Apple #Nvidia #Google #Amazon #LiquidAI
@asrgooyeshpardaz
❤ 3👍 1🔥 1👌 1
⚙️ مدل متنباز جدید چینی: «Tongyi DeepResearch» با ۳۰٫۵ میلیارد پارامتر
🎯 تیم Tongyi Lab از اولین عامل وب متنباز (Web Agent) رونمایی کرده است که در آزمونهای کلیدی حتی از OpenAI DeepResearch عملکرد بهتری نشان میدهد:
📊 ۳۲٫۹ امتیاز در آزمون Humanity’s Last Exam (ارزیابی تواناییهای آکادمیک)
🏆 ۷۵ امتیاز در xbench-DeepSearch (سناریوهای واقعی کاربران)
🔍 ۴۳٫۴ / ۴۶٫۷ در BrowseComp (جستوجوی پیچیده و چندمرحلهای اطلاعات)
🚀 درونمایه و ویژگیها:
چرخهٔ آموزشی کامل: از پیشآموزش تا یادگیری تقویتی (RL) 🔄
تولید دادههای مصنوعی باکیفیت، کاملاً بدون دخالت انسان 🤖
دو حالت عملکرد: ReAct (استاندارد) و Heavy (برای وظایف دشوار) ⚡️
💡 کاربردهای واقعی فعلی:
🗺 برنامه Gaode Mate: برنامهریز هوشمند سفر
⚖️ برنامه Tongyi FaRui: دستیار حقوقی با بررسی خودکار منابع
📂 کد منبع و مدلها در دسترس هستند:
🔗 GitHub
🔗 Hugging Face
#هوش_مصنوعی #Alibaba #DeepResearch
@asrgooyeshpardaz
❤ 9👏 3🤣 2👍 1
🌐 تحولات تازه در دنیای هوش مصنوعی
📚 دگرگونی نقش ویکیپدیا در فضای اینترنت
نقش ویکیپدیا در زیستبوم اینترنت دستخوش تغییری بنیادین شده است. در حالیکه شمار بازدیدکنندگان انسانی آن رو به کاهش است، سامانههای هوش مصنوعی روزبهروز بیشتر از دادههای آن بهطور مستقیم بهره میگیرند، بیآنکه کاربران را به صفحات وب هدایت کنند.
بدینترتیب، ویکیپدیا از یک منبع تولید محتوا به بستر راستیآزمایی اطلاعات تبدیل شده است.
این پروژه از ابزارهای هوش مصنوعی برای شناسایی و جلوگیری از ویرایشهای مشکوک ــ از جمله درج اطلاعات نادرست، اهانتآمیز یا تبلیغاتی ــ استفاده میکند. سامانه بهطور خودکار این تغییرات را منتشر نمیکند، اما فرایند بررسی و تصمیمگیری را برای ویراستاران انسانی تسهیل میکند.
از آنجا که فروش مستقیم دادهها، برخلاف پلتفرمهایی چون Reddit، برای ویکیپدیا امکانپذیر نیست، این نهاد طرح اشتراک ویژه برای دسترسی لحظهای به دادههای تازهویرایششده را راهاندازی کرده است؛ از جمله نخستین مشترکان آن، شرکت گوگل است.
هزینه سالانه نگهداری این پلتفرم در حدود ۱۷۸ میلیون دلار برآورد میشود که بخش عمدهای از آن صرف زیرساخت و سرورهای داده میگردد.
🔗 ft.com
🤖 معرفی ربات انساننمای خانگی Noetix Bumi
استارتاپ چینی Noetix Robotics نخستین ربات مصرفی خود را با نام Bumi معرفی کرده است. این ربات ۹۴ سانتیمتر قد، ۱۲ کیلوگرم وزن و ۲۱ درجه آزادی حرکتی دارد.
ربات Bumi قادر است بر روی دو پا راه برود، حرکات نرم و حتی رقصهای نمایشی انجام دهد. بدنه آن از مواد کامپوزیتی سبک ساخته شده و از فرمانهای صوتی پشتیبانی میکند. همچنین دارای محیط برنامهنویسی اختصاصی برای توسعه مهارتهای جدید است.
قیمت این ربات ۹٬۹۸۸ یوان چین (حدود ۱٬۴۰۲ دلار آمریکا) اعلام شده است.
🔗 SCMP
🎧 مدل چندوجهی Audio Flamingo 3 از NVIDIA
شرکت انویدیا از مدل جدید خود با نام Audio Flamingo 3 رونمایی کرده است؛ سامانهای چندوجهی که توانایی درک و تحلیل صدا، گفتار و موسیقی را دارد.
این مدل از ترکیب چند فناوری پیشرفته ساخته شده است:
کدک صوتی AF-Whisper برای رمزگشایی صدا
مدل زبانی Qwen 2.5 7B برای درک مفهومی و زبانی
ماژول تولید گفتار برای پاسخدهی صوتی
مدل Audio Flamingo 3 میتواند فایلهای صوتی تا ده دقیقه را تحلیل و محتوای زبانی و معنایی آن را در گفتوگوهای چندمرحلهای بازتولید کند. این مدل در بیش از ۲۰ آزمون بنچمارک عملکرد برجستهای نشان داده و بهصورت باز برای پژوهشهای علمی در پلتفرمهای PyTorch و Transformers عرضه شده است.
🔗 Hugging Face
🎨 معماری جدید تولید تصویر Kuaishou SVG
شرکت Kuaishou Technology از معماری تازهای برای مدلهای تولید تصویر با نام SVG رونمایی کرده است. در این مدل، برخلاف روشهای مرسوم، از مؤلفهی Variational Autoencoder (VAE) استفاده نشده است.
مدل SVG با تکیه بر نمایشهای خودیادگیرنده (Self-supervised Representations) سرعت آموزش را ۶۲ برابر و سرعت استنتاج را ۳۵ برابر افزایش داده است. در عین حال، کیفیت و پایداری تصاویر نیز ارتقا یافته است. حذف VAE سبب کاهش اعوجاج در فضای نهفته و افزایش دقت در تولید تصاویر با وضوح بالا شده است.
🔗 Hugging Face Paper
⚡ افت سهام شرکتهای انرژی پس از تب هوش مصنوعی
سهام شرکتهای انرژی که در ماههای اخیر با رونق هوش مصنوعی رشد چشمگیری داشتند، در هفته گذشته با کاهش حدود ۱۲ درصدی روبهرو شدند — بزرگترین افت از فوریه تاکنون.
در این میان، شرکت Oklo با افت ۳۰ درصدی و Vistra با کاهش ۱۲ درصدی بیش از دیگران زیان دیدند. تحلیلها نشان میدهد که با پیشرفت مدلهای بهینهتر و کممصرفتر، انتظار برای رشد تقاضای انرژی کاهش یافته است. همچنین شرکت GE Vernova نسبت به کند شدن روند سرمایهگذاری هشدار داده است.
با این حال، همه چشماندازها منفی نیست: دولت ایالات متحده در حال تسریع اتصال مراکز داده به شبکه برق است و شرکت Oracle نیز برای تأمین سرمایه ساخت مراکز دادهی جدید، در آستانه انتشار اوراق قرضه قرار دارد.
🔗 Bloomberg
#خبر #هوش_مصنوعی #فناوری #ویکیپدیا #رباتیک #تحلیل_بازار
#AI #news #NVIDIA #Kuaishou
@asrgooyeshpardaz
❤ 2🔥 2👍 1😎 1
