第一层是 HARD 关键词拦截。如果用户输入命中了预设的高风险词(比如泰语中明确表达自杀意图的表述),直接跳过 AI 判断,立刻触发防护流程。第二层是 LLM 二次分类。如果没有命中关键词,让 AI 判断这段文字的风险等级。第三层是兜底逻辑:如果 AI 调用失败(网络超时、模型报错),默认按高风险处理,宁可误报也不漏报。
第四,运营成本谁来扛? 项目活着一天就有成本——模型 API 调用费、服务器费用、数据库费用,一个月可能几百块。量不大但会持续涨。什么时候需要开始想付费模式?用户对”被 AI 倾听”这件事愿意付多少钱?这是一个完全没有数据的假设。
第五,AI 共情的伦理边界在哪? 这个问题是我做完后想得最多的。AI 输出”你比自己以为的更靠近答案”这类话时,确实能让人感到被理解。但产品做得越温柔、越像真人,用户越可能对 AI 产生情感依赖而远离真正的人际支持。这个矛盾不是技术能解决的,需要专门的产品策略——比如在适当时机引导用户去联系真人咨询师,而不是继续和 AI 对话。