在幽兰上安装 Ollama - Powered by MinDoc

Ollama 是一个开源的大模型服务工具，可以支持 Llama 3，Phi 3，Mistral，Gemma 和其他多种模型，也可以创建自己的模型，并且支持 MacOS，Linux，以及 Windows 多种系统。

1.下载 Ollama 可执行文件

打开幽兰命令行终端，输入以下命令：

wget https://ollama.com/download/ollama-linux-arm64

下载可能需要特殊的网络环境。下载结束后，我们将 Ollama 放到 /usr/bin 目录下，为了方便将名字改成 Ollama，然后添加可执行权限：

sudo mv ~/ollama-linux-arm64 /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

2.配置 Ollama

在 /etc/systemd/system/ 下创建服务文件 ollama.service：

sudo vi /etc/systemd/system/ollama.service

在 vi 界面，输入 i 进入输入模式，然后添加下面内容：

[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=root
Group=root
Restart=always
RestartSec=3

[Install]
WantedBy=default.target

然后按 ESC 键位，输入 ：wq保存即可。

接下来配置 Ollama，自定义模型存放路径：

sudo systemctl edit ollama.service

同样用上面的方法，将下面的内容输入进去。在这里/gewu/这个文件夹就是我指定的模型存放路径，大家可以根据自己需求进行更改，比如/home/geduer也可以。

[Service]
Environment="OLLAMA_MODELS=/gewu/"

3.启动 Ollama 服务

在输入下面命令即可启动：

sudo systemctl daemon-reload
sudo systemctl enable ollama
sudo systemctl start ollama

这三条命令只需要输入一次，即使关机下次重新开机，也不需要再输入了。

4.使用 Ollama

考虑到笔记本性能有限，在这里我们运行的大语言模型为阿里云开发的 Qwen 0.5b，在命令行输入下面命令即可：

ollama run qwen:0.5b

由于初次启动 Qwen 模型，需要从 Ollama 网站下载模型文件，所以时间较长。如果下载出错，可以多试几次，等待加载完毕，出现下面的提示信息时，就可以体验了。

下次再使用时，不必再下载模型文件，会直接进入。

现在你可以输入任何问题了。

当你问完问题想退出时，输入:

>>> /bye

即可。

作者：李宜桐创建时间：2024-05-09 13:57
最后编辑：沈根成更新时间：2025-12-23 14:22