隐私政策
1. 这是一个自托管项目
Tiny LLM Studio 的所有代码都开源、可审计,部署形态为:
- 本地运行:你在自己的 MacBook 上跑
scripts/07_corpus_platform.sh,全部数据留在你的硬盘 - 容器化部署:用本仓库提供的
docker compose起容器,运行在你自己(或你信任的)服务器上
没有任何"官方服务器"。你看到的这个介绍站本身也只是一组静态 HTML/CSS/JS 文件 + 一个 nginx 容器, 不存在任何后端用户系统、不存在任何登录功能。
2. 我们不收集什么
- 没有埋点 / 无任何 analytics:不嵌入 Google Analytics、百度统计、PostHog、Sentry 等第三方分析或错误上报 SDK。
- 不设 cookie:站点不写任何 cookie;广告/追踪 cookie 更不可能存在。
- 没有账号系统:没有登录、注册、邮箱、手机号、身份证、支付信息——这些字段在源码里压根不存在。
- 不外发任何用户数据:你的训练语料、tokenizer、checkpoint、对话内容全部留在本机/你的服务器,本项目从不主动向外发送数据。
3. 我们做了什么
- 把全部源代码开放在仓库里,欢迎自行审计每一行。
-
在你的浏览器里使用
localStorage仅保存一项 主题偏好(key:tiny-llm-site-theme,值:"light"或"dark"),用于让深色模式记住你的选择,不离开你的浏览器。 -
通过
HF_ENDPOINT=https://hf-mirror.com等环境变量让你能在国内顺利使用,但具体连不连、连哪里,由你自己控制。
4. 第三方资源(CDN)
文档页(docs.html)和首页通过 CDN 加载了几个开源前端库,仅用于渲染页面,不向其传任何业务数据:
cdn.jsdelivr.net:marked.js(Markdown 渲染)、highlight.js(代码高亮)、mermaid.js(流程图渲染)
这些 CDN 服务商按其自身政策可能记录访问 IP(这是 HTTP 协议层面的固有行为)。 如果你介意这一点,可以:
Studio 的 WebUI 本身(localhost:8000)已经做了"零外部依赖"——所有 vendor 资源都本地化,关掉网络也能跑。
5. 你的训练数据归你所有
Tiny LLM Studio 在采集语料、训练 tokenizer、训练模型的过程中,会从 HuggingFace、维基百科等公开数据源下载内容到你的硬盘。这些数据:
- 仅存储在你本地(默认在项目根
data/、checkpoints/、runs/) - 不会被本项目自动上传到任何地方
- 训练得到的模型权重、tokenizer 也仅生成在本地
6. 自部署使用者的责任
如果你把本项目部署给他人使用(例如内部团队、对外 demo),你成为该实例的"数据控制者"。 请告知你的用户:
- 实例是由谁部署、跑在什么硬件上、谁能访问数据库 / 卷
- 是否有反向代理(nginx / Cloudflare 等)记录了访问日志
- SQLite 数据卷(
tiny-llm-studio-data)是否会被定期清理
本项目作者不为下游部署的隐私实践承担责任,但乐于在 issue 区帮你审视配置。
7. 隐私政策变更
如本政策有任何更新,会修改本页面顶部的"最后更新"日期。 由于本站点没有任何用户系统,我们无法主动通知你;建议关注仓库的 commit 记录。
8. 联系方式
关于隐私的疑问、漏洞披露、或建议,请直接到项目仓库提 issue。 由于本项目自托管的本质,我们也不留邮箱以避免被钓鱼。
本页面没有任何脚本上报任何信息。你可以打开浏览器开发者工具 → 网络面板,自行验证所有请求都仅指向本站点和上述 CDN 静态资源。