docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:0.5.10
vim /opt/ollama/compose.yml
version: "3.9"
services:
ollama:
image: ollama/ollama:0.5.9
container_name: ollama
hostname: ollama
restart: always
ports:
- "11434:11434"
volumes:
- /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime:ro
- ./hosts:/etc/hosts:ro
- ./data:/root/.ollama
environment:
- OLLAMA_HOST="0.0.0.0:11434"
- OLLAMA_ORIGINS="*"
- OLLAMA_BASIC_AUTH="admin:123456"
0.0.0.0
为所有主机*
为所有地址username:password
格式curl -fsSL https://ollama.com/install.sh | OLLAMA_VERSION=版本号 sh
1. 下载安装包
wget https://github.com/ollama/ollama/releases/download/v0.5.10/ollama-linux-amd64.tgz
wget https://github.com/ollama/ollama/releases/download/v0.5.10/ollama-linux-amd64-rocm.tgz
需要先安装 CUDA 服务(官方文档及下载地址: https://developer.nvidia.com/cuda-downloads),然后使用普通安装包安装
2. 解压安装包
tar -C /usr -xzf ollama-linux-amd64.tgz
3. 启动 Ollama
ollama serve
4. 配置为系统服务
useradd -r -s /bin/false -U -m -d /usr/share/ollama ollama
usermod -a -G ollama $(whoami)
vim /etc/systemd/system/ollama.service
[Unit]
Description=Ollama Service
After=network-online.target
[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=$PATH"
[Install]
WantedBy=default.target
systemctl daemon-reload
systemctl enable ollama
1. 停止服务
systemctl stop ollama
systemctl disable ollama
2. 删除文件
rm /etc/systemd/system/ollama.service
rm $(which ollama)
rm -r /usr/share/ollama
userdel ollama
groupdel ollama
rm -rf /usr/local/lib/ollama
下载 OllamaSetup.exe
安装包后直接安装即可。
1. 下载 zip 包
根据实际情况下载 zip 包:
ollama-windows-amd64.zip
: X86 架构使用ollama-windows-arm64.zip
: ARM 架构使用2. 下载 rocm zip 包(使用 AMD GPU 时需要)
下载指定版本的 ollama-windows-amd64-rocm.zip
包(需要和普通zip包版本一致)。
3. 解压 zip 包至自定义目录
将 ollama-windows-*.zip
解压至自定义目录,若使用了 rocm
包,则将此包解压至相同目录。
4. 编辑环境变量(可选)
编辑当前用户的环境变量,可配置项如下:
OLLAMA_HOST
: 监听地址,默认为 127.0.0.111434
(仅允许本地访问),可配置为 0.0.0.0:11434
(允许所有地址访问)OLLAMA_ORIGINS
: 允许的请求域,默认为 127.0.0.1
(仅允许本地访问),可配置为 *
(允许所有地址访问)OLLAMA_MODELS
: 模型存放地址,默认为 ~/.ollama/models
,可按需配置OLLAMA_KEEP_ALIVE
: 模型在显存中保持加载的持续时间,默认为 5m
,可按需配置OLLAMA_DEBUG
: 是否以调试模式启动,默认为 0
,配置为 1
时启用调试5. 运行 ollama 服务
打开 cmd 命令行提示符,cd 至解压的目录,然后运行 ollama.exe serve
即可。
示例如下:
cd D:\Apps\ollama\0.6.0\ollama-windows-amd64
ollama.exe serve
下载安装包后直接安装即可。
安装包下载地址: