DraganSr: AI: Local RAG System with Ollama & Qdrant verctor db

Saturday, May 31, 2025

AI: Local RAG System with Ollama & Qdrant verctor db

Let's Build a Local RAG System with Ollama & Qdrant - YouTube (live stream recorded)
by Maximilian Schwarzmüller Extended - YouTube

mschwarzmueller/basic-rag-demo: A basic demo for building a RAG system with Qdrant & Ollama @GitHub

Maximilian Schwarzmüller | AWS certified, Professional Web Developer and Instructor | Udemy

Ollama

Get up and running with large language models.
Run DeepSeek-R1, Qwen 3, Llama 3.3, Qwen 2.5‑VL, Gemma 3, and other models, locally.

to run Ollama in Docker (desktop)

ollama/ollama - Docker Image | Docker Hub

Basic CPU-Only Setup

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

-d: Runs the container in detached mode (background).
-v ollama:/root/.ollama: Creates a volume to persist Ollama data.
-p 11434:11434: Maps the container's port 11434 to the host's port 11434.
--name ollama: Assigns the name "ollama" to the container.
ollama/ollama: Specifies the official Ollama Docker image.
--gpus=all: Enables access to all available GPUs.

Nvidia GPU Support:
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

--gpus=all: Enables access to all available GPUs.

AMD GPU Support:

docker run -d --device /dev/kfd --device /dev/dri -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm

--device /dev/kfd --device /dev/dri: Enables access to AMD GPU devices.
ollama/ollama:rocm: Specifies the Ollama Docker image with ROCm support.

After running the container, you can interact with Ollama through its API, typically at http://localhost:11434

To run AI/LLM model

docker exec -it ollama ollama run llama3

https://huggingface.co/blog/llama3

The Llama 3.1 release introduces six new open LLM models based on the Llama 3 architecture. They come in three sizes: 8B, 70B, and 405B parameters, each with base (pre-trained) and instruct-tuned versions

What is Qdrant? - Qdrant

Qdrant “is a vector similarity search engine (DB) that provides a production-ready service with a convenient API to store, search, and manage points (i.e. vectors) with an additional payload.”

Local Quickstart - Qdrant

Saturday, May 31, 2025

AI: Local RAG System with Ollama & Qdrant verctor db

No comments: