Docker

Vane (Perplexica 2.0) Ollama 와 llama.cpp 를 이용한 빠른 시작

Vane (Perplexica 2.0) Ollama 와 llama.cpp 를 이용한 빠른 시작

로컬 LLM을 활용한 자체 호스팅 AI 검색

Vane 은 “인용된 AI 검색” 분야에서 더 실용적인 솔루션 중 하나입니다. 이는 실시간 웹 검색과 로컬 또는 클라우드 LLM 을 결합하면서도 전체 스택을 사용자의 통제 하에 두는 자체 호스팅형 답변 엔진입니다.

에르메스 AI 어시스턴트 - 설치, 설정, 워크플로우 및 문제 해결

에르메스 AI 어시스턴트 - 설치, 설정, 워크플로우 및 문제 해결

개발자를 위한 Hermes Agent 설치 및 빠른 시작

Hermes Agent은 로컬 머신이나 저비용 VPS에서 실행되는 자체 호스팅(model-agnostic) AI 어시스턴트입니다. 터미널 및 메시징 인터페이스를 통해 작동하며, 반복되는 작업을 재사용 가능한 스킬로 변환하여 시간이 지남에 따라 지속적으로 성능을 향상시킵니다.

TGI - 텍스트 생성 추론 - 설치, 구성, 문제 해결

TGI - 텍스트 생성 추론 - 설치, 구성, 문제 해결

TGI 를 설치하고 빠르게 배포하며 더 빠르게 디버깅하세요.

Text Generation Inference(TGI) 는 매우 특유의 에너지를 지니고 있습니다. 추론 분야에서 가장 새로운 기술은 아니지만, 이미 프로덕션 환경에서 발생하는 문제를 잘 이해하고 있습니다.

GPU 및 영구 모델 스토리지 사용 Docker Compose 기반 Ollama

GPU 및 영구 모델 스토리지 사용 Docker Compose 기반 Ollama

GPU 와 영속성을 갖춘 Compose 우선 Ollama 서버

Ollama 는 베어 메탈 (bare metal) 환경에서 훌륭하게 작동합니다. 이를 서비스처럼 다룰 때 더욱 흥미로운데, 안정적인 엔드포인트, 고정된 버전, 영구 저장소, 그리고 GPU 가 있거나 없는 명확한 상태를 보장받기 때문입니다.

OpenAI 호환 로컬 LLM을 위한 llama.swap 모델 스위처 빠른 시작 가이드

OpenAI 호환 로컬 LLM을 위한 llama.swap 모델 스위처 빠른 시작 가이드

클라이언트를 변경하지 않고 로컬 LLM을 핫스왑합니다.

곧 vLLM, llama.cpp 등 여러 스택을 각각 다른 포트에서 관리하게 될 것입니다. 모든 다운스트림 시스템은 여전히 하나의 /v1 기본 URL 을 요구하며, 그렇지 않으면 포트, 프로필, 일회성 스크립트를 계속 조정해야 합니다. llama-swap은 이러한 스택들 앞에 위치한 /v1 프록시입니다.

개발자 도구: 현대 개발 워크플로우 완벽 가이드

개발자 도구: 현대 개발 워크플로우 완벽 가이드

소프트웨어 개발에는 버전 관리를 위한 Git, 컨테이너화를 위한 Docker, 자동화를 위한 bash, 데이터베이스를 위한 PostgreSQL, 편집을 위한 VS Code 가 사용되며, 생산성에 지대한 영향을 미치는 수많은 다른 도구들이 함께 작동합니다. 이 페이지에서는 전체 개발 스택을 효율적으로 활용하는 데 필요한 핵심 치트시트, 워크플로우, 비교 자료를 모았습니다.

OpenHands 코딩 비서 빠른 시작: 설치, CLI 플래그, 예시

OpenHands 코딩 비서 빠른 시작: 설치, CLI 플래그, 예시

OpenHands CLI, 몇 분 만에 빠르게 시작하세요

OpenHands 는 AI 기반 소프트웨어 개발 에이전트를 위한 오픈소스, 모델 불특정 플랫폼입니다. 이 플랫폼은 에이전트가 단순한 자동 완성 도구가 아닌, 실제 코딩 파트너처럼 행동할 수 있도록 합니다.

LocalAI 빠른 시작: OpenAI 호환 대형 언어 모델을 로컬에서 실행하기

LocalAI 빠른 시작: OpenAI 호환 대형 언어 모델을 로컬에서 실행하기

분산형 로컬 AI 를 통해 OpenAI 호환 API 를 LocalAI 로 몇 분 안에 자체 호스팅하세요.

LocalAI 는 자신의 하드웨어 (노트북, 워크스테이션, 온프레미스 서버) 에서 AI 워크로드를 실행하기 위해 설계된 자체 호스팅, 로컬 우선 추론 서버로, OpenAI API 와의 호환성을 제공하여 기존 도구를 그대로 사용할 수 있도록 합니다.