Ollama

W tym teście porównuję, jak różne LLMs hostowane na Ollama tłumaczą stronę Hugo z języka angielskiego na niemiecki.

Ponowne rankowanie tekstów przy użyciu Ollama i Qwen3 Embedding LLM – w Go

Ten niewielki przykład kodu Go do rerankingu wywołuje Ollamę do generowania wektorów dla zapytania oraz dla każdego dokumentu kandydackiego, następnie sortuje wyniki malejąco według podobieństwa kosinusowego.

Modele Qwen3 Embedding i Reranker na Ollama: osiągnięcia stanowiące stan techniki

Modele Qwen3 Embedding i Reranker (https://www.glukhov.org/pl/rag/embeddings/ “Modele Qwen3 Embedding i Reranker na platformie ollama”) to najnowsze wydania z rodziny Qwen, zaprojektowane specjalnie do zaawansowanych zadań związanych z tworzeniem wektorów tekstu (embedding), odnajdywaniem informacji (retrieval) oraz ponownym ocenianiem wyników (reranking).

Wydajność modeli językowych i kanały PCIe: kluczowe zagadnienia

Jak liczba linii PCIe wpływa na wydajność LLM? W zależności od zadania. Dla treningu i inferencji wielo-GPU spadek wydajności jest znaczący.

Konwertuj zawartość HTML na Markdown za pomocą LLM i Ollama

W bibliotece modeli Ollama są modele, które potrafią konwertować zawartość HTML na Markdown, co jest przydatne w zadaniach związanych z konwersją treści. Ten przewodnik jest częścią naszego Narzędzia dokumentacyjne w 2026: Markdown, LaTeX, PDF i przepływ pracy druku hub.

Poniżej wymienię narzędzia wspomagające kodowanie z pomocą AI oraz Asystentów AI do Kodowania i ich zalety.

Test: Jak Ollama wykorzystuje wydajność i efektywne jądra procesora Intel

Mam teorię do przetestowania – czy wykorzystanie Wszystkich rdzeni na procesorze Intel podniesie prędkość LLM? Zdenerwuje mnie fakt, że nowy model gemma3 27 bit (gemma3:27b, 17GB na ollama) nie mieści się w 16GB VRAM mojej karty graficznej, a częściowo działa na procesorze.

Gdy serwer Ollama otrzymuje dwa żądania jednocześnie, jego zachowanie zależy od konfiguracji i dostępnych zasobów systemowych.

Modeli DeepSeek pierwszego pokolenia z wydajnością porównywalną do modeli OpenAI-o1, w tym sześć gęstych modeli oddestylowanych z DeepSeek-R1 opartych na Llama i Qwen.

Ten ściągawka CLI Ollama skupia się na poleceniach, których używasz na co dzień (ollama ls, ollama serve, ollama run, ollama ps, zarządzanie modelami i typowe przepływy pracy), wraz z przykładami do kopiowania i wklejenia.

Nieco wcześniej wydano. Przejdźmy do sprawy i
testuj jak Mistral Small radzi sobie w porównaniu do innych LLM.

Reranking to drugi krok w systemach RAG (Retrieval Augmented Generation), znajdujący się bezpośrednio między pobieraniem (Retrieving) a generowaniem (Generating).

Wspaniałe jedzenie to również przyjemność dla oczu. Ale w tym poście porównamy dwa systemy wyszukiwania oparte na AI: Farfalle i Perplexica.

To jest bardzo ekscytujące! Zamiast korzystać z Copilota lub perplexity.ai i informować cały świat o swoich potrzebach, możesz teraz hostować podobną usługę na własnym komputerze lub laptopie!

Niedawno widzieliśmy kilka nowych LLM, które zostały wydane. Wspaniałe czasy. Zróbmy test i zobaczmy, jak działają, gdy wykrywają błędy logiczne.

Nadal istnieją pewne powszechne podejścia do pisania dobrych promptów, dzięki czemu LLM nie będzie się pogubił, próbując zrozumieć, czego od niego oczekujesz.

Ollama

Porównanie jakości tłumaczenia stron w Hugo – LLMs na Ollama

Ponowne rankowanie tekstów przy użyciu Ollama i Qwen3 Embedding LLM – w Go

Modele Qwen3 Embedding i Reranker na Ollama: osiągnięcia stanowiące stan techniki

Wydajność modeli językowych i kanały PCIe: kluczowe zagadnienia

Konwertuj zawartość HTML na Markdown za pomocą LLM i Ollama

Porównanie asystentów programowania AI

Test: Jak Ollama wykorzystuje wydajność i efektywne jądra procesora Intel

Jak Ollama Obsługuje Wątki Równoległe

Testowanie Deepseek-R1 na Ollama

Skrót komend Ollama CLI: ls, serve, run, ps i inne (aktualizacja 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 i Phi – test modeli językowych

Ponowne rankowanie za pomocą modeli osadzeń

Farfalle kontra Perplexica

Hostowanie Perplexica z wykorzystaniem Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Napisywanie skutecznych promptów dla LLMs