zora
发布于 2026-04-26 / 0 阅读
0
0

一 AI文本创作工具本地安装和配置

随着AI小说、漫剧的爆火,离线私有化 AI 部署成为规避数据风险、降低使用成本的最优选择。依托开源生态,普通设备即可流畅运行轻量级开源大模型。本文围绕Ollama+Qwen3:14B+SillyTavern组合,打造专属本地 AI 文本创作系统,无需联网、数据全程本地存储,支持自定义人设、长文本创作、创意文案生成等场景。下文将详细介绍三大核心组件的安装步骤、环境配置和联动方法,帮助快速搭建属于自己的私有 AI 创作工作站。

1、模型选择及功能

1)模型管理工具:

ollama

2)模型选择:

Qwen3 系列(当前最佳中文写作模型之一)

ollama run qwen3:9b (9B 参数,原生支持 32K,可扩展)

ollama run qwen3:14b (更大参数量,智商更高)

Mistral 系列(创意写作王者)

ollama run mistral:7b (原生 8K,但可通过 RoPE 扩展到 32K)

ollama run dolphin-mistral:7b (去限制版,更听话)

DeepSeek-V2 或 V3 的 Lite 版(超长上下文霸屏)

ollama run deepseek-v2:16b-lite-chat (追求超长记忆)

Gemma 系列(Google 出品,角色扮演佳)

ollama run gemma3:12b (12B,很能打)

3)基于Ollama的写作前端

前端工具

类型

优点

长记忆支持

上手难度

SillyTavern

专为角色扮演和小说创作设计

内置角色卡、世界设定、自动摘要、Lorebook(世界书),直接对接Ollama

非常强:自带向量记忆、作者注释、世界书系统,能在对话中自动检索相关设定

简单,有中文社区教程

NovelCrafter

纯写作工作台

专为长篇小说设计,有章节管理、大纲规划,可以用Ollama作后端

中:靠项目笔记、角色卡实现,不如SillyTavern智能

非常简单,页面清爽

Obsidian + AI插件

笔记软件变身写作神器

你可以在熟悉的笔记环境里写作,通过插件调用Ollama续写

灵活:靠Obsidian的链接和元数据管理长篇,记忆靠你手动构建

需要配置,但自由度极高

RisuAI / TavernAI

轻量角色扮演前端

参数可调,无多余功能,直接连Ollama

基础:历史消息记忆,无高级检索

很低

2、架构逻辑及相关组件下载

软件/模型

版本(标签)

下载及说明

Ollama

v0.7.0 (稳定版)

从官网下载:https://ollama.com/download
选择对应系统的版本,默认安装即可。无需特意配置CUDA,安装包已包含。

Node.js

LTS (长期支持版)

从官网下载:https://nodejs.org/
这是运行 SillyTavern 的必需环境,建议安装 LTS 版本以获得最佳稳定性。

Git

最新版

从官网下载:https://git-scm.com/downloads/win
用于从代码仓库克隆 SillyTavern,安装时保持默认配置即可。

Qwen3:14b 模型

qwen3:14b
qwen3:14b-fp16 (16位全精度)


安装好Ollama后,在终端中执行 ollama pull qwen3:14b 即可自动下载。
模型参数14.8B,qwen3:14b 量化版大小约 9.3GB,启动快、占用显存小;全精度版推理精度更高,但需要约 30GB 空间。你的16G显存建议直接运行默认版。

辅助记忆模型

shaw/dmeta-embedding-zh

用于 SillyTavern 的“向量化记忆”功能。在终端中执行 ollama pull shaw/dmeta-embedding-zh 下载。

SillyTavern

release 分支 (稳定版)

通过命令下载,非下载链接。
打开终端,进入安装的目录,执行以下命令克隆并启动:
git clone https://github.com/SillyTavern/SillyTavern -b release
cd SillyTavern
./start.bat
切记:安装路径不能包含中文。

3、环境部署

安装目录:本地硬盘创建/AI目录,安装ollama至该目录下,后续相关软件也存放于此,避免出现中文、空格等可能导致软件运行出错的字符。

1)ollama安装

通过官网获取安装包或github下载:https://ollama.com/download

2)Node.js安装

通过官网获取安装包或ggithub下载:https://nodejs.org/ ,建议下载LTS版本,独立文件打开即用,但需要配置环境变量

3)Git安装

通过官网获取下载链接:https://git-scm.com/install/windows

安装过程建议使用使用其他GUI编辑器作为git的默认编辑器

5)模型和辅助模型安装
4)SillyTavern安装

在之前创建的/AI目录下,打开cmd终端,通过国内代码平台,克隆SillyTavern 镜像

## 通过国内镜像平台克隆
git clone https://gitee.com/mirrors/SillyTavern.git
## 远程地址修改回github
cd SillyTavern
git remote set-url origin https://github.com/SillyTavern/SillyTavern.git

4、启动和初始配置

1)启动SillyTavern

进入克隆好的 SillyTavern 文件夹

双击start.bat 会打开一个powershell终端显示nmp install

等待完成浏览器会自动打开 http://localhost:8000 界面。如果没有,手动在浏览器输入这个地址即可。

根据提示输入用户名称,进入界面;

2)SillyTavern 连上 Ollama

在SillyTavern界面顶部,点击插头图标(🔌)进入连接设置

API 选择 文本补全 (Text Completion)

API 地址 填 http://127.0.0.1:11434

模型选择qwen3:14b或手动输入my-qwen3-novel (后续创建该模型)

连接出现小绿点标识连接成功

3)参数修改,匹配长文本

创建Modelfile文件

FROM qwen3:14b
PARAMETER num_ctx 32768
PARAMETER temperature 0.7
PARAMETER top_p 0.9
PARAMETER repeat_penalty 1.1
PARAMETER stop "<|im_end|>"
PARAMETER stop "<|im_start|>"

参数说明:

  • FROM qwen3:14b:基于已下载的基础模型。

  • PARAMETER num_ctx 32768:将上下文长度设置为 32k。之后可以根据创作需要,尝试调整到 65536 甚至 131072

  • temperature:建议创意写作调至 0.7-0.9

  • stop:是指定正确的停止符,避免AI自由发挥一直生成下去出现幻觉。

应用配置

在创建的Modelfile文件目录打开cmd终端,输入ollama create my-qwen3-novel -f ./Modelfile应用配置,my-qwen3-novel 就是写作专用的新模型名。


评论