LLM

نموذج تخصيص الذاكرة في جدولة إصدار Ollama الجديد - v0.12.1

هنا أقارن كمية الـVRAM التي تخصصها الإصدار الجديد من Ollama للموديل مع الإصدار السابق من Ollama. الإصدار الجديد أسوأ.

Ollama أصبح من بين الأدوات الأكثر شعبية بسرعة لتشغيل نماذج LLM محليًا. بواجهة سطر الأوامر البسيطة وإدارة النماذج المبسطة، أصبحت خيارًا مفضلاً للمطورين الذين يريدون العمل مع نماذج الذكاء الاصطناعي خارج السحابة. لكن كما هو الحال مع منصات واعدة كثيرة، هناك مؤشرات مبكرة على Enshittification:

يتيح Ollama المضيف محليًا تشغيل نماذج لغات كبيرة على جهازك الخاص، ولكن استخدامه عبر سطر الأوامر ليس ودودًا للمستخدم.
هناك عدة مشاريع مفتوحة المصدر توفر واجهات تشبه ChatGPT تربط مع Ollama المحلي.

نفيديا دي جي إكس سبارك - كمبيوتر فائق صغير جديد للذكاء الاصطناعي

نvidia على وشك إصدار NVIDIA DGX Spark - جهاز كمبيوتر صغير جداً لتشغيل الذكاء الاصطناعي بناءً على بنية Blackwell مع 128+ جيجابايت من الذاكرة الموحّدة و 1 PFLOPS من أداء الذكاء الاصطناعي. جهاز رائع لتشغيل نماذج الذكاء الاصطناعي الكبيرة (LLMs).

بروتوكول سياق النموذج (MCP)، والملاحظات حول تنفيذ خادم MCP في لغة Go

هنا لدينا وصف بروتوكول سياق النموذج (MCP)، ملاحظات قصيرة حول كيفية تنفيذ خادم MCP في Go، بما في ذلك هيكل الرسالة، ومواصفات البروتوكول.

إعادة ترتيب الوثائق باستخدام Ollama ونموذج Qwen3 Reranker - بلغة Go

بما أن Ollama القياسي لا يحتوي على واجهة برمجة تطبيقات (API) لترتيب النتائج (Rerank) مباشرة، فإنك ستحتاج إلى تنفيذ ترتيب النتائج باستخدام نموذج Qwen3 Reranker في GO من خلال إنشاء تمثيلات (embeddings) للزوجات (query-document) وتصنيفها.

مقارنة جودة ترجمة صفحات Hugo - نماذج لغوية كبيرة على Ollama

في هذا الاختبار، أنا مقارنة كيف تترجم نماذج LLM المختلفة المضمنة في Ollama صفحات Hugo من الإنجليزية إلى الألمانية. ثلاث صفحات اختبرتها كانت على مواضيع مختلفة، وتحتوي على بعض العلامات المرجعية الجيدة مع بعض الهيكل: العناوين، والقوائم، والجداول، والروابط، وغيرها.

إعادة ترتيب النصوص باستخدام Ollama و Qwen3 Embedding LLM - بلغة Go

هذا المثال الصغير كود Go لترتيب المعاودة يدعو Ollama لإنشاء تضمينات للمستفسر ولكل وثيقة مرشحة، ثم ترتيبها تنازليًا حسب التشابه الكسبي.

نماذج Qwen3 Embedding & Reranker على Ollama: أداء متميز المستوى العالمي

النماذج Qwen3 Embedding و Reranker هي أحدث الإصدارات في عائلة Qwen، وتم تصميمها خصيصًا للمهام المتقدمة في تضمين النصوص، والبحث، والترتيب مرة أخرى.

أداء النماذج الكبيرة جداً وقنوات PCIe: اعتبارات رئيسية

كيف تؤثر مسارات PCIe على أداء النماذج الكبيرة؟ يعتمد ذلك على المهمة. بالنسبة للتدريب والتنبؤ متعدد GPUs - فإن انخفاض الأداء كبير.

تحويل محتوى HTML إلى Markdown باستخدام نموذج لغوي كبير وollama

في مكتبة نماذج Ollama هناك نماذج قادرة تحويل محتوى HTML إلى Markdown، وهو مفيد للمهام المتعلقة بتحويل المحتوى.

البحث مقابل البحث العميق مقابل البحث العميق حقًا

البحث هو الأفضل للحصول على معلومات بسرعة ووضوح باستخدام الكلمات المفتاحية.
البحث العميق يتفوق في فهم السياق والنية، مما يؤدي إلى نتائج أكثر صلة وشمولًا للأسئلة المعقدة.

مقارنة مساعدي كتابة الكود الذكاء الاصطناعي

سأ列举一些由人工智能辅助的编程工具和 مساعدي البرمجة بالذكاء الاصطناعي وفوائدهم الرائعة.

استخدام نماذج LLM ليس مكلفًا جدًا، وقد لا يكون هناك حاجة لشراء وحدة معالجة رسومات جديدة رائعة. إليك قائمة بـ مزوّدي LLM في السحابة مع النماذج التي يحتويها.

اختبار: كيف يستخدم Ollama أداء وحدات المعالجة المركزية ووحدات المعالجة الفعالة من إنتل

لدي نظرية أريد اختبارها - هل استخدام جميع النوى على معالج Intel CPU سيزيد سرعة نماذج LLM؟ (اختبار: كيف يستخدم Ollama أداء معالج Intel ووحدات النوى الفعالة) يزعجني أن نموذج gemma3 27 بت (gemma3:27b، 17GB على ollama) لا يناسب 16GB VRAM لبطاقتي الرسومية، ويتم تشغيله جزئيًا على المعالج.

مقارنة ملاءمة وحدات معالجة الرسومات من نفيديا للذكاء الاصطناعي

في وسط الفوضى في العالم الحديث هنا أنا مقارنة مواصفات التكنولوجيا المختلفة المناسبة لمهام الذكاء الاصطناعي (التعلم العميق, كشف الكائنات ونماذج الذكاء الاصطناعي الكبيرة). ولكنها جميعًا باهظة التكلفة للغاية.

نموذج تخصيص الذاكرة في جدولة إصدار Ollama الجديد - v0.12.1

إنهيكتيفيكيشن أولا م - أعراض المبكرة

واجهات المحادثة لمحليات Ollama

نفيديا دي جي إكس سبارك - كمبيوتر فائق صغير جديد للذكاء الاصطناعي

بروتوكول سياق النموذج (MCP)، والملاحظات حول تنفيذ خادم MCP في لغة Go

إعادة ترتيب الوثائق باستخدام Ollama ونموذج Qwen3 Reranker - بلغة Go

مقارنة جودة ترجمة صفحات Hugo - نماذج لغوية كبيرة على Ollama

إعادة ترتيب النصوص باستخدام Ollama و Qwen3 Embedding LLM - بلغة Go

نماذج Qwen3 Embedding & Reranker على Ollama: أداء متميز المستوى العالمي

أداء النماذج الكبيرة جداً وقنوات PCIe: اعتبارات رئيسية

تحويل محتوى HTML إلى Markdown باستخدام نموذج لغوي كبير وollama

البحث مقابل البحث العميق مقابل البحث العميق حقًا

مقارنة مساعدي كتابة الكود الذكاء الاصطناعي

مزوّدو نماذج LLM السحابية

اختبار: كيف يستخدم Ollama أداء وحدات المعالجة المركزية ووحدات المعالجة الفعالة من إنتل

مقارنة ملاءمة وحدات معالجة الرسومات من نفيديا للذكاء الاصطناعي