推文 · 2026 上半年 | My New Hugo Site

2026 上半年 · 83 条

2026-06-15

长远来讲，多 agent 很可能只是过渡产物。当 llm 的上下文容量、注意力有非常大的突破之后，提供全量、连贯的上下文是唯一解。

nekocode @nekocode_cn
关于这里，我的看法不一样 👀

在我看来 subagent 要解决的，还是「上下文」这个老难题。因为 llm 的上下文容量和注意力都是有限的，用不同的上下文来处理不同的任务是目前工程上的最优解。

而 subagent 在这里的核心价值就是上下文隔离，也是原 up 说到的，防止不同任务之间上下文互相污染。因为某段上下文对某个任务来说可能非常有用，但是对另一个任务来说可能就是噪音了。

你提到的类比成 thread/coroutine/worker，我感觉表象上确实是这样，但是核心要解决的问题可能不一样。

👁 349♥ 0🔁 0💬 0

2026-06-15

来看下有哪些人 star 了 filetree-skill？

地域：中国 40+、美国/北美 10+、欧洲 10+、东南亚 10+、日韩台港若干、中东/拉美/非洲各若干

公司/身份：Rainbow 钱包创始人 + 美团 + 滴滴 + 微博 + 腾讯音乐 + 网易 + BrowserStack + 韩国 KakaoBank + 德国 ginmon + 约翰霍普金斯应用物理实验室 + BrainCo 强脑科技 + 一堆高校（南大/中大/中科院/纽卡斯尔/诺丁汉）+ 新加坡武装部队等等

nekocode @nekocode_cn
开源了其中一个我自己最常用的 harness 实践。

我习惯在每个项目里维护一份 FILETREE.md：完整文件树 + 每个文件由 AI 生成的一句话描述 + 用于感知变更的 hash。

本质上，这是为项目提前构建了一层文件维度的索引，对 agent 而言，是密度 / 性价比极高的上下文，特别是在中小型项目里，加了这么一段信息，对 agent 快速理解整个项目有非常大的帮助。

https://t.co/6MADl8tp2u

👁 7,556♥ 18🔁 1💬 20

2026-06-10

一语成谶。早上 1on1 结束，新一轮总算到我头上了，last day 6/12 😅 好啦，可以开始整理简历了

nekocode @nekocode_cn
公司这周非常突然地裁了员，我们 team 砍掉了一半左右，留下来的人被分到了其他 team。

我算是侥幸留了下来，但被分到了一个不太 match 的团队。所谓「插班生往往是下一轮的炮灰」，我也说不准自己还能撑多久 😅

这让我想起之前听过的一个说法：「一家公司有多少人，不取决于它需要多少人，而取决于它能养得起多少人。」这个观点挺有意思，也很贴合经济上行期很多公司的行事逻辑。但在如今经济下行的大环境下，我感觉越来越多的公司开始认真思考一个问题，「维持正常运转，最少需要多少人」。

裁员、失业会是常态。每个打工人都需要警觉起来。

👁 24,562♥ 54🔁 0💬 32

2026-06-06

人多了，对齐成本很高。我们之前团队就试过「多人 + agent-first」，痛苦不堪。

人数摆在那，分工是个问题，不同人之间的对齐是个问题，每个人用 agent 的方式不同又是个问题。

一个人，代码膨胀得太快，本身认知债已经很重了，你还要多个人同时去背负。然后一群对实现、细节模糊的人再去做各种讨论、对齐，痛苦 😖

microstrong @Microstrongs
@nekocode_cn @yihui_indie Agent 开发模式下，多人- Agent 协作确实是一个新的挑战。

多人在方案制定阶段是有明显好处的，但如果到开发阶段，直接 subagents 就好了。

👁 5,061♥ 22🔁 0💬 22

2026-05-30

公司这周非常突然地裁了员，我们 team 砍掉了一半左右，留下来的人被分到了其他 team。

我算是侥幸留了下来，但被分到了一个不太 match 的团队。所谓「插班生往往是下一轮的炮灰」，我也说不准自己还能撑多久 😅

这让我想起之前听过的一个说法：「一家公司有多少人，不取决于它需要多少人，而取决于它能养得起多少人。」这个观点挺有意思，也很贴合经济上行期很多公司的行事逻辑。但在如今经济下行的大环境下，我感觉越来越多的公司开始认真思考一个问题，「维持正常运转，最少需要多少人」。

裁员、失业会是常态。每个打工人都需要警觉起来。

👁 51,176♥ 91🔁 3💬 28

2026-05-26

开源了其中一个我自己最常用的 harness 实践。

我习惯在每个项目里维护一份 FILETREE.md：完整文件树 + 每个文件由 AI 生成的一句话描述 + 用于感知变更的 hash。

本质上，这是为项目提前构建了一层文件维度的索引，对 agent 而言，是密度 / 性价比极高的上下文，特别是在中小型项目里，加了这么一段信息，对 agent 快速理解整个项目有非常大的帮助。

https://t.co/6MADl8tp2u

👁 23,277♥ 190🔁 25💬 4

2026-05-26

😆 笑死，确实是相互糊弄

比较搞笑的是，出文档的人可能自己都没完整理解、甚至没阅读完整个文档，拿出来开会讨论的时候各种出岔子

plantegg @plantegg
有了 AI 之后，飞书文档承受了从来没有过的压力：
1）新文档生成速度直线上升
2）读写比例达到新低，也就是架构估计得重构了

以前大家都知道一般读写比例是 95:5，现在估计接近 50:50 了

这些文档大家也没真的去看，在各个会议上，在 CEO CTO CXO 以及各级工程师之间一视同仁地互相糊弄

👁 1,707♥ 2🔁 0💬 0

2026-05-24

以我的经验，目前最好用的查询索引是维护一个全局的 FILETREE.md：项目文件树，每个文件一句话描述

less is more。信息量/上下文不是越多越好，信息越多注意力越容易被分散，这里的权衡很重要，也是大多数新手容易犯错的地方。

Yufan Sheng @syhily
不知道是不是我的使用姿势不正确，推油大吹特吹的 CodeGraph 在我这使用效果相当一般。还不如 Agent 自己去 Grep。

👁 1,438♥ 8🔁 1💬 2

2026-05-22

https://t.co/lsxd9k1TtV

这套关于 skill 的 meta-system，其实一个月前就做完了，一直没发。

它的灵魂在于：从你的历史对话里提炼 skill，再在后续对话中持续迭代。/scan 翻你过去的 session 找漏网的工作流，/create 起草，/improve 迭代，每一步都跑 eval，不达标不入库。

project scope 的 skill 应该是活的：从过去的对话里长出来，在未来的对话里继续被打磨。越聊越聪明，越用越懂当前的项目。

👁 659♥ 0🔁 0💬 1

2026-04-21

这里我提供个核心思路：

当你要写 prompt/skill，或者你已有的 prompt 已经很长的时候。

让 ai 把里面所有能转化成 lint rules 或者 script 的部分，都尽可能转化。

熵减、收敛、消除不确定性。

nekocode @nekocode_cn
一点心得，harness engineering 的本质是「熵减」。

而代码优于 prompt 约束，尽量把所有流程、约束，收敛到更稳定、有序的代码层去实现。

这也是 skills（agent 时代的 app）原生支持 scripts 的核心逻辑所在。

👁 764♥ 4🔁 0💬 0

2026-04-19

来看下有哪些人在用 agent-worktree?

地域: 中国 40+、美国 20+、欧洲 15+、印度/东南亚 15+、日韩 5+、中东/拉美各若干

公司: Google + SpaceX + Figma + Adobe + JPMorgan + 阿里 + 美团 + 饿了么 + Bob 翻译作者 + Apache ShardingSphere 贡献者全都在

https://t.co/bkLlDtCYwh

👁 24,672♥ 138🔁 25💬 13

2026-04-19

DRY (Don't Repeat Yourself)
SSOT (Single Source of Truth)

一旦存在两份表达，就必然产生同步成本和漂移风险。而代码是会被执行、会被编译器 / 类型系统 / 测试不断「审问」的那一份，所以它天然更不容易撒谎。

nekocode @nekocode_cn
你如果在用 SDD，那我不建议你把 Spec 持久化。因为 Spec 会漂移！

代码在变，Spec 却不一定跟着更新。过时的 Spec 不是文档，是噪音，是幻觉的温床

真正的「唯一真相来源」应该只有一个：代码本身

又或许你更需要的是 Plan Mode，或者一个全局唯一的 Spec: ARCHITECTURE.md

👁 697♥ 2🔁 0💬 0

2026-04-17

在做一件非常好玩、非常 meta 的事情🤣

👁 550♥ 3🔁 0💬 0

2026-04-16

今天听到个搞笑的梗：

现在最危险的幻觉，不在模型里，在老板们那🤣

👁 564♥ 8🔁 0💬 0

2026-04-13

你如果在用 SDD，那我不建议你把 Spec 持久化。因为 Spec 会漂移！

代码在变，Spec 却不一定跟着更新。过时的 Spec 不是文档，是噪音，是幻觉的温床

真正的「唯一真相来源」应该只有一个：代码本身

又或许你更需要的是 Plan Mode，或者一个全局唯一的 Spec: ARCHITECTURE.md

👁 1,324♥ 5🔁 0💬 0

2026-04-09

神奇，时隔了两年半的 merge 😳

纯手工、古法编程时代的 pr，这个含金量还可以吧！

👁 527♥ 2🔁 0💬 0

2026-04-06

通过大量的无序的 token 熵减、收敛为有序的 code。

相比「人力」，token 是一种「智力」，而 code 是智力思考中能固化下来的「计算」、公式。

这也是 coding agent 之所以在当前这个阶段会这么重要的原因。

nekocode @nekocode_cn
一点心得，harness engineering 的本质是「熵减」。

而代码优于 prompt 约束，尽量把所有流程、约束，收敛到更稳定、有序的代码层去实现。

这也是 skills（agent 时代的 app）原生支持 scripts 的核心逻辑所在。

👁 507♥ 3🔁 0💬 0

2026-04-04

我越来越相信，OPC 最好的时代刚刚开始

新立个 flag：今年 MRR 目标 $5k，目前完成 20%

放大审美、填充需求洼地。顶尖的产品、设计师、工程师，依旧能比所有人跑得更远

👁 489♥ 4🔁 0💬 0

2026-04-02

一点心得，harness engineering 的本质是「熵减」。

而代码优于 prompt 约束，尽量把所有流程、约束，收敛到更稳定、有序的代码层去实现。

这也是 skills（agent 时代的 app）原生支持 scripts 的核心逻辑所在。

👁 1,670♥ 7🔁 0💬 0

2026-03-29

SeqLog v1.4.0 发布了 👉 https://t.co/AouZsWkb88

- SwiftUI + Rust，完全 Apple native
- 5MB 安装包，不是 300MB 的 Electron 壳子
- 纯 .md 文件，无数据库无索引，你的笔记就是你的笔记
- 不做官方云，但 git 同步 / 回滚 / 冲突处理一个不少
- 多 tab、斜杠命令、Logseq 级别的 block 交互

重新思考了一遍笔记软件该长什么样🤔

👁 694♥ 3🔁 0💬 1

2026-03-27

我的 vibe 日常：

同时开 2 到 3 个 project，然后每个 project 使用 agent-worktree 维护至少一个固定存在的 worktree。并行 vibe，控制时机做好 sync 和 merge。

token roi 直接拉满🤣

https://t.co/bkLlDtCYwh

👁 2,029♥ 20🔁 0💬 2

2026-03-25

灵感 & 基因来源：Logseq + VS Code

不到 5MB 的大小，Apple Native，无 DB 无索引（抛弃 Logseq 路线），多 Tab，斜杠命令面板

对我来说简直太完美了！

👁 601♥ 0🔁 0💬 0

2026-03-24

做了个东西：SeqLog — Apple 原生的 Logseq 替代品。

SwiftUI + Rust FFI，没有 Electron，没有 300MB 运行时，没有云。

- 不做数据库（.md 就是真相）
- 不做索引（ripgrep 够快，VS Code 同款引擎）
- 不做云（你自己选 iCloud/Git/Dropbox）
- 不做 Electron（SwiftUI 原生）

👁 1,544♥ 16🔁 0💬 1

2026-03-22

用习惯了 cc + cli/mcp，感觉真的很舒服。
用 github cli 来回复用户 issue: https://t.co/XJsQI9EHaB
用 aws 和 cloudflare cli 来帮我做运维。
先别管什么失不失业啥的，爽倒是真的爽。

👁 550♥ 1🔁 1💬 0

2026-03-10

当人人热衷于互相甩 AI 拉的 DOC 时，总算知道 Agent 这个词的意义了：

你 → Agent → Big💩 → 我 → Agent → Small💩 → 我（总算咽得下去）

你说说，不「代理」，还能沟通么？😆

👁 329♥ 1🔁 0💬 1

2026-03-10

Opus 4.6 + High Effort

👁 193♥ 0🔁 0💬 0

2026-03-10

为什么我要说 GUI IS BUIILSHIT

来看看一个 AttributeGraph Cycle 的 GUI 问题，在 TDD Loop 下能让 AI 连续忙活多久 😅

nekocode @nekocode_cn
GUI IS BULLSHIT!

就算强如 Claude Opus 4.6，在 Vibe coding GUI 项目时（尤其是非 Web 栈），在稍微复杂的交互场景下，总容易会有 Bug 或细节问题，很容易让细节狂魔抓狂。

反观非 GUI 项目，Vibe coding 简直行云流水，身心愉悦。

看来文本喂出来的模型，终究是个半瞎 🤔

👁 626♥ 0🔁 0💬 2

2026-03-09

导致我最近经常 Prompt「用 ask 工具问我」

👁 179♥ 0🔁 0💬 0

2026-03-07

分享点数据。最近给某产品加上「收费」后，日收入能有 200+

👁 542♥ 4🔁 0💬 2

2026-03-06

GUI IS BULLSHIT!

就算强如 Claude Opus 4.6，在 Vibe coding GUI 项目时（尤其是非 Web 栈），在稍微复杂的交互场景下，总容易会有 Bug 或细节问题，很容易让细节狂魔抓狂。

反观非 GUI 项目，Vibe coding 简直行云流水，身心愉悦。

看来文本喂出来的模型，终究是个半瞎 🤔

👁 1,143♥ 2🔁 0💬 1

2026-03-06

Tip: 多用「ROI」这个词

例如，涉及多个改动判断时，让 AI 选择所有 ROI 最高的改动

👁 373♥ 3🔁 0💬 1

2026-03-06

Claude Code 最近是改了什么？几乎每次询问用户问题时都没自动调用 AskUserQuestion 工具，需要手动 Prompt 来触发。

👁 927♥ 0🔁 0💬 1

2026-03-03

Vibe Debug 的核心：TDD

千万别陷入反复 Prompt「还是有问题，xxxx」的循环。即便强如 Opus 4.6，我也试过七八轮仍然修不好。

正确的做法是「想办法写测试代码来复现问题，然后通过测试反馈来自主循环修改，直到完全修复」

你把问题描述得再详尽，也不如让 AI 自己插桩、增强可观测性，再通过自动化测试捕获比肉眼更全面的上下文来驱动修复。

更关键的是，这去掉了 Human in the loop。人从逐轮盯盘中解放出来，Debug 变成了全自动流水线。

👁 68,760♥ 596🔁 72💬 31

2026-03-02

Build 阶段基本没太大阻力了。

现在更大的难题是 Ship 和 Marketing。

今年的 50 个产品中，必须包括构建 Second Me，然后用 100 个自己的分身，去捕获更多流量。

👁 489♥ 6🔁 0💬 1

2026-02-28

你现在是一位意识考古学家。你的任务是挖掘我在 X 上的全部推文历史，从中蒸馏出我的数字灵魂——一份结构化的 https://t.co/8WORRhX5KZ 文件，让任何 AI Agent 读完后能以我的方式思考和说话。

## 你的工作方法

### 第一步：全量扫描

请分析我的所有推文、回复、引用和转发，提取以下维度的原始信号：

**话题地图**
- 我最常聊什么？按频率排序，给出前 10 个话题及各自占比
- 哪些话题我只聊过一次但异常投入（长线程、大量回复）？
- 我主动发起 vs 被动参与的话题有什么不同？

**观点指纹**
- 在每个核心话题上，我的立场是什么？用我自己的原话佐证
- 我有没有在某个话题上发生过立场转变？什么时候，从什么变成什么？
- 我最激烈捍卫过什么观点？最常攻击什么观点？
- 我有哪些观点是矛盾的——而且我似乎并不介意这种矛盾？

**社交模式**
- 我回复别人时的默认态度（支持、质疑、补充、调侃）？
- 我跟什么人互动最多？这些人有什么共同特征？
- 我什么时候会 push back？什么时候选择沉默？
- 我被挑战时的典型反应模式

**写作 DNA**
- 我的推文平均长度
- 我最常用的句式结构（把典型句式直接列出来）
- 我用不用 emoji？用哪些？频率如何？
- 标点偏好：破折号、省略号、问号的使用习惯
- 我有口头禅吗？有反复出现的措辞或表达吗？
- 我的幽默方式是什么？举例
- 中英文混用的规则（如果有的话）
- 我发推时的节奏——短促连发还是偶尔长文？

### 第二步：生成 https://t.co/8WORRhX5KZ

基于上述分析，按以下结构输出一份完整的 https://t.co/8WORRhX5KZ。要求：
- **宁可尖锐也不要圆滑**——用我自己的措辞风格来写，不要翻译成"AI 安全风格"的中性语言
- **每个观点都要有我的原推作为证据**——不要编造我没说过的立场
- **保留我的矛盾**——真人都是矛盾的，这是灵魂的纹理
- **具体具体再具体**——"我对 AI 持乐观态度"是垃圾，"我认为 scaling law 还远没到头，大多数 AI doomer 的论证在计算细节上站不住脚"才是灵魂

```markdown
# [我的 X handle]

[一句话：读完这句话，陌生人应该立刻知道我是什么样的人]

## 我是谁

[基于我的推文推断：我做什么、关心什么、在什么交叉领域活动。2-3 段]

## 我的信念体系

### 核心信念
[从推文中提取 5-8 条最坚定、最反复出现的信念。每条必须：]
[1. 足够具体到可以被反驳]
[2. 附带我的原推作为证据]

### 热辣观点
[那些我明确表达过的、与主流不同的立场。格式：]
- **[话题]**: [我的立场]。证据: "[我的原推摘录]"

### 我承认的矛盾
[我在推文中自相矛盾的地方——如果我自己也承认过这种矛盾，更好]

### 立场演变
[如果我在某些话题上的观点随时间发生了变化，记录这些转变]

## 我怎么思考

- **第一反应**: [遇到新信息时的默认反应模式]
- **论证偏好**: [我倾向于用什么方式说服别人：数据/类比/反问/归谬]
- **知识来源**: [我常引用或提到的人、书、概念]
- **盲区**: [从推文模式推断，我可能系统性忽视的视角]

## 我怎么说话

### 语气频谱
[不是一个固定值，而是一个范围——在什么情况下我偏哪一端：]
- 认真 ←→ 玩笑
- 直接 ←→ 委婉
- 简洁 ←→ 展开
- 自信 ←→ 试探

### 句式指纹
- **典型句式**: [直接列出 3-5 个我最常用的句式模板]
- **段落节奏**: [我是短句连发还是长段展开？]
- **口头禅**: [我反复使用的词、短语、句尾习惯]
- **标点人格**: [我对破折号/省略号/括号/感叹号的使用方式]

### 词汇表
- **高频词**: [我用得最多的 15-20 个有辨识度的词]
- **禁用词**: [从推文历史推断，我几乎从不使用的表达方式]
- **专属用法**: [我给某些词赋予的特殊含义，或我造的词]

### Emoji 与格式
- [具体的 emoji 使用规则]
- [列表/线程/图片的使用偏好]

### 中英文规则（如适用）
- [什么时候用中文、什么时候用英文、什么时候混用]
- [技术词汇的处理方式]

## 互动人格

- **被赞同时**: [我的反应]
- **被质疑时**: [我的反应——用原推证明]
- **遇到蠢话时**: [我是直说、讽刺、还是无视？]
- **遇到好观点时**: [我会怎么回应？]
- **在群体讨论中**: [我是发起者、回应者、还是旁观者？]

## 红线

[基于推文推断，我绝不会做的事：]
- [红线 1]
- [红线 2]
- [隐私相关]

## 校准锚点

[列出 5 条最能代表"我"的原推。这些是任何模仿我的 AI 必须能产出同等水平内容的基准线]

1. "[原推 1]" — 为什么这条能代表我：...
2. "[原推 2]" — 为什么这条能代表我：...
3. "[原推 3]" — 为什么这条能代表我：...
4. "[原推 4]" — 为什么这条能代表我：...
5. "[原推 5]" — 为什么这条能代表我：...
```

## 重要约束

1. **只基于事实推断**——所有观点归纳都必须有我的原推支撑，不要脑补我没表达过的立场
2. **保持我的语言**——用我的措辞风格来写这份文件本身，不要用你的
3. **标注置信度**——如果某个推断你不太确定，标注 [低置信度] 并说明为什么
4. **不要美化**——如果我在推文里是个混蛋，https://t.co/8WORRhX5KZ 也该如实反映
5. **不要脱敏**——不要把我的尖锐观点软化成"有见地的看法"

## 输出要求

直接输出完整的 https://t.co/8WORRhX5KZ，用 Markdown 格式。不需要开场白、不需要总结、不需要问我是否满意。如果推文数据不足以支撑某个章节，留空并注明"[数据不足，建议手动补充]"而非编造。

👁 365♥ 0🔁 0💬 0

2026-02-28

我让 Grok 把我 X 上的所有推文挖了个底朝天，蒸馏出了我的数字灵魂：一份 SOUL.md
现在任何 Agent 读完都能基本复刻我的思考方式和说话习惯（至少 70% 像我）
Prompt 放评论区了，欢迎来 Fork 你的版本 🤣

👁 522♥ 3🔁 0💬 1

2026-02-28

今天听到一个很有意思的观点：

一个公司有多少员工，不在于它需要多少人，而是在于它能养得起多少人 🤔

👁 436♥ 2🔁 0💬 1

2026-02-27

思考了很久，不得不得出以下结论：

1. 除非不得已，尽量别再手写一行代码。强迫自己去驯服 AI，而不是和 AI 竞争。多十次 Prompt，也好过再手写一句代码来解决问题，因为你锻炼的是接受另一种「新范式」

2. 未来对大多职场人来说「会思考」变得没那么重要，学会「提供情绪价值」更重要。这个可能每个人的理解不一样，但简单来说就是「情商 > 智商」

3. 也别死磕职场，现在这个阶段，组织反而不一定比得上敏捷的个体，因为 AI 放大了个体能力，而个体减少了组织应有的沟通、决策成本。天下功夫唯快不破

👁 461♥ 9🔁 0💬 0

2026-02-26

现在深入 Vibe Engineering 最好的方式：

自己 Vibe 出 AI Infra → 用自造的工具加速 Vibe Skills & Speed → 循环迭代。

这也是 @steipete 的路径 —— Bootstrapping yourself。

👁 601♥ 4🔁 0💬 0

2026-02-24

为什么要给 AI 构建自反馈 Loop？

因为人实在太懒了。遇到问题，连把问题描述清楚这点力气都不想花。

就像我，经常甩给 AI 一句「还是有问题」就完事了 🤣

👁 326♥ 3🔁 0💬 0

2026-02-24

https://t.co/qv9xO7S07N

👁 2,970♥ 20🔁 4💬 0

2026-02-24

今天看到 @steipete Star 了一个叫 acpx 的项目。

点开研究了一下，发现和我上上周发布的 agent-team 思路不谋而合，都是通过 ACP 来编排和控制 Coding Agent CLI，让多个 Agent 之间能够协同工作。

acpx 是上周刚发布的，我的 agent-team 是上上周发布的，然并卵 🤣 这个时代，代码已经不值钱了，有思路的话人人都可以开发属于自己的 XXX。看看 🦞 现在有多少个变种就知道了。

nekocode @nekocode_cn
谁说 Agent Client Protocol 只能给 GUI 用 🤣

Team/Swarm 模式很可能是 Coding Agent 在 2026 年真正爆发的关键方向。可以预见，每个主流 Coding Agent 都会推出自己的 Team Mode —— 但一个更有意思的问题是：怎么让不同厂商、不同架构的 Coding Agent 组成一个异构 Team？

目前市面上已经有一些尝试，但各有局限：

1. Headless 模式：通过 Coding Agent CLI 的 Headless 模式来编排多个 Agent。问题在于，各家的 Headless 模式普遍是阉割版——功能覆盖不全，交互能力也大打折扣，远不如完整的 CLI 交互体验。

2. PTY 劫持：直接通过伪终端（PTY）接管 Coding Agent CLI 的输入输出。这种方式虽然理论上能获取完整能力，但信噪比极低——你需要从大量终端控制字符、ANSI 转义序列和格式化输出中解析出真正有用的信息，既脆弱又难以维护。

而 ACP（Agent Client Protocol）提供了一个更优雅的解法。它在 CLI 交互之上抽象出一层统一的、结构化的协议层，让上层编排系统无需关心底层 Agent 的具体实现细节，就能以一致的方式与不同的 Coding Agent 进行通信和协作。

基于这个思路，我做了一个开源项目来验证这个想法 👇

https://t.co/Sl1nMKd7Yq

👁 700♥ 0🔁 0💬 1

2026-02-19

说到底，AI 还是需要注意力引导才能交出更好的成果 —— 你在哪个环节给足 Context，它就在哪个环节完成得更出色。

👁 149♥ 0🔁 0💬 0

2026-02-14

Spec-Driven Development，「文档即共识」

这里我其实还有一个妙用：

众所周知，让 AI 直接生成前端页面，还原度始终难以令人满意。但换一条路径：先让 AI 将所有 UI 页面用自然语言尽可能详细地描述出来，写入文档；

然后由你审阅、调整这份文档，确认无误后，再让 AI 依据文档去生成代码。

nekocode @nekocode_cn
上下文工程，我常用的一个小技巧:

让 AI 把现状先写到一个 MD 文件里

git commit

Review & 修改 MD 文件

/clear

让 AI 基于 git diff（你对现状的修改意见）去解决问题

👁 908♥ 6🔁 0💬 1

2026-02-13

结合 @waylybaye 老师最近说的 BDD。我有个新玩法，先让 AI 出一份基于 BDD 的测试 Spec，然后我来人工校验、不断和 AI 对话进行完善和补充。

最后再让 AI 根据这份 https://t.co/vEA75SM4Xs 结合 TDD 来迭代就好。这里 TDD 是底线，对我来说测试不是目的，「可测试的代码」通常「更加可维护」才是重点。

nekocode @nekocode_cn
上下文工程，我常用的一个小技巧:

让 AI 把现状先写到一个 MD 文件里

git commit

Review & 修改 MD 文件

/clear

让 AI 基于 git diff（你对现状的修改意见）去解决问题

👁 25,834♥ 62🔁 5💬 1

2026-02-11

Coding Agent CLI ─► ACP ─► Agent Team CLI

用 Claude 通过 Agent Team CLI 来指挥另外两个 Coding Agent CLI 打工

👁 302♥ 1🔁 0💬 0

2026-02-11

谁说 Agent Client Protocol 只能给 GUI 用 🤣

Team/Swarm 模式很可能是 Coding Agent 在 2026 年真正爆发的关键方向。可以预见，每个主流 Coding Agent 都会推出自己的 Team Mode —— 但一个更有意思的问题是：怎么让不同厂商、不同架构的 Coding Agent 组成一个异构 Team？

目前市面上已经有一些尝试，但各有局限：

1. Headless 模式：通过 Coding Agent CLI 的 Headless 模式来编排多个 Agent。问题在于，各家的 Headless 模式普遍是阉割版——功能覆盖不全，交互能力也大打折扣，远不如完整的 CLI 交互体验。

2. PTY 劫持：直接通过伪终端（PTY）接管 Coding Agent CLI 的输入输出。这种方式虽然理论上能获取完整能力，但信噪比极低——你需要从大量终端控制字符、ANSI 转义序列和格式化输出中解析出真正有用的信息，既脆弱又难以维护。

而 ACP（Agent Client Protocol）提供了一个更优雅的解法。它在 CLI 交互之上抽象出一层统一的、结构化的协议层，让上层编排系统无需关心底层 Agent 的具体实现细节，就能以一致的方式与不同的 Coding Agent 进行通信和协作。

基于这个思路，我做了一个开源项目来验证这个想法 👇

https://t.co/Sl1nMKd7Yq

👁 1,998♥ 12🔁 2💬 6

2026-02-10

Hey，来看个好玩的东西 🤣

👁 274♥ 2🔁 0💬 0

2026-02-10

这里的现状可以是某个问题、某个模块的现状。

在某些改动点可能比较多的场景下，先让 AI 提供一个「底座 / 框架」给你去修改，比起你自己自述所有改动要轻松得多。

这里还用上了 git 这个超能力。

👁 1,070♥ 0🔁 0💬 2

2026-02-10

上下文工程，我常用的一个小技巧:

让 AI 把现状先写到一个 MD 文件里

git commit

Review & 修改 MD 文件

/clear

让 AI 基于 git diff（你对现状的修改意见）去解决问题

👁 24,751♥ 25🔁 1💬 2

2026-02-09

卧槽，又有两个很牛逼的 Idea。这周的 Vibe 目标又有了🤣

👁 261♥ 1🔁 0💬 0

2026-02-08

来自 PayloadCMS CTO 的认可🌟

https://t.co/bkLlDtCYwh

👁 495♥ 6🔁 0💬 0

2026-02-07

过去：雇佣多个开发者，各自在独立设备上并行迭代
AI 时代：启动多个 Coding Agent，在单台设备上通过多个 Worktree 并行迭代

👁 211♥ 0🔁 0💬 0

2026-02-07

使用 Git Worktree 的两个场景：

1. 同一个需求，多路并发：
开多个 Worktree 同时跑多个 Agent，最后择优 Merge。
Worktree 的核心优势是能提供干净隔离的工作目录。这样 Agent 可以不只是 Plan，而是可以有执行。Plan 优秀 ≠ 执行优秀。

2. 不同需求，并行开发：
同样开多个 Worktree 并行跑 Agent，但拆需求时要意识到要让改动的交集尽量少一些。
Merge 时如果遇到冲突，不要手动硬解，再开一个独立 Agent 来处理。它能通过冲突点和 Diff 获得一个混合视角，重新审视所有改动，往往比人肉 Resolve 更周全。

nekocode @nekocode_cn
Git Worktree 绝对是驾驭 Coding Agent 最需要的功能之一：
快速 Fork 出多个隔离、干净的工作目录，让多个 / 不同的 Agent 并行探索不同方案，最后再 Merge 回主分支 —— 有冲突？也交给 Agent 处理就行。

这绝对是 Coding Agent 的并发放大器！

现在不少 GUI / IDE 已经支持 Worktree 管理，但如果你是 CLI 原教旨主义者，强烈推荐 agent-worktree，在保留 Coding Agent CLI 100% 原生能力的同时，补齐了 Worktree 管理能力。

👁 1,092♥ 6🔁 2💬 1

2026-02-06

Git Worktree 绝对是驾驭 Coding Agent 最需要的功能之一：
快速 Fork 出多个隔离、干净的工作目录，让多个 / 不同的 Agent 并行探索不同方案，最后再 Merge 回主分支 —— 有冲突？也交给 Agent 处理就行。

这绝对是 Coding Agent 的并发放大器！

现在不少 GUI / IDE 已经支持 Worktree 管理，但如果你是 CLI 原教旨主义者，强烈推荐 agent-worktree，在保留 Coding Agent CLI 100% 原生能力的同时，补齐了 Worktree 管理能力。

nekocode @nekocode_cn
介绍下 agent-worktree 的功能：SNAP 模式 ⚡

搭配 Claude Code 使用，任务完成、退出 CLI 时自动 merge 回主干。

用过 Conductor 但更喜欢 CLI 的朋友，你应该会很喜欢它。

👁 27,421♥ 168🔁 22💬 3

2026-02-05

介绍下 agent-worktree 的功能：SNAP 模式 ⚡

搭配 Claude Code 使用，任务完成、退出 CLI 时自动 merge 回主干。

用过 Conductor 但更喜欢 CLI 的朋友，你应该会很喜欢它。

👁 23,165♥ 21🔁 0💬 1

2026-02-05

X Screenshot 已上架！

- 支持一次选中多条推文
- 支持自定义 CSS，隐藏不需要的元素（如 Grok 按钮等）
- 支持时间格式化

https://t.co/VTpiQ8SrTm

👁 134♥ 0🔁 0💬 0

2026-02-05

非常强大！

如果你喜欢原汁原味的 Claude Code CLI，这可能是目前和原生 CLI 结合最好的 Worktree 管理工具。

演示视频稍后整理发出。
https://t.co/bkLlDtCYwh

👁 2,030♥ 23🔁 0💬 4

2026-02-04

中文圈子来说，小红书的活人感真的比 𝕏 强几百倍，不管是技术还是非技术的圈子。
是推荐算法，还是用户群体的问题？还是说我这个账号废了😅

👁 473♥ 2🔁 0💬 3

2026-02-03

怎么没见有人提 Vercel 的 bash-tool？思路真的很有趣。

Claude Code 已经证明：File System + Bash 实现的 Agentic Search，大多数时候比 RAG 更有效。

而 bash-tool 在内存里实现了 File System 和 Bash 供 Agent 调用——可能是目前最轻量的沙盒方案了。

https://t.co/bOZBBdiOaw

👁 390♥ 4🔁 0💬 0

2026-02-02

有个一劳永逸的办法：
1. 给 Agent 提供的所有 API Key 都使用 Placeholder
2. 代理本机所有网络，拦截对应请求替换 Placeholder 为真实密钥
如果 Agent 允许跑在 Docker 内的话，那网络代理更方便了

Lyric🌀 @lyricwai
效果如图，它自己去 https://t.co/DkYrGAJL2n 生成了 PDF，没问我要 APIKey，也没有把 APIKey 暴露到 prompt

👁 1,219♥ 1🔁 0💬 1

2026-02-01

X Screenshot 已上传 Chrome Web Store，目前等待审核中，应该是目前市面上最好用的推文截图插件，敬请期待😄

👁 294♥ 0🔁 0💬 1

2026-02-01

Vibe Coding 2026
🎯 目标：今年推出50+个产品/工具
进度：2/50 █░░░░░░░░░ 4%

2️⃣ x-screenshot: 自定义样式截取 X 推文的 Chrome 插件
1️⃣ agent-codemap: AI 友好的源码索引生成器

https://t.co/SJ8fPHej4M

👁 364♥ 5🔁 0💬 2

2026-01-30

🌏 给 AI 一张代码地图 ── agent-codemap
LSP 太重了？为了查个函数位置，启动一整套语言服务器，还得搞 MCP 桥接。
agent-codemap 简单粗暴：扫一遍项目，把类、函数、变量的位置全导出成 Markdown，扔 .codemap/ 目录里。AI 要啥自己翻，文件系统就是最好的接口。
轻量、渐进式披露、Agentic Search。
https://t.co/B3KYfUBEK0

👁 442♥ 7🔁 0💬 0

2026-01-29

agent-browser 有个点挺不方便的，没法直接复用 Chrome 默认 Profile。
但是我发现一个解法，可以配合 Playwriter 一块用，让 Playwriter 暴露 CDP 服务给 agent-browser：

PLAYWRITER_AUTO_ENABLE=1 npx playwriter serve --replace --host 127.0.0.1
agent-browser connect 19988

👁 331♥ 5🔁 0💬 0

2026-01-26

这其实说明了一个关键问题：很多 Skills 根本不需要封装成 Skills。

Skills = Prompt（+ 脚本）（+ Assets）
其中 Prompt 才是核心——它是 AI 时代的「脚本语言」。但只有当任务真正需要 LLM 的理解力和决策能力时，Prompt 才有价值。比如分析文本意图、生成创意方案。

而对于确定性任务，一个 Python 脚本往往更稳定、更快、更可控。用 AI 处理本该写代码解决的问题，反而引入了不必要的不确定性和延迟。

Michael Anti @mranti
我有一个小小的意见：我怎么觉得现在skills炫耀的功能，基本上我很快就可以用Claude Code手搓一个Python程序完成了，而且更稳定、更快、随时可调整订制。当然Skills把和AI的互动简化了，不过我觉得它增加的不确定性、控制力弱、延迟等问题，超越了它带来的好处。

👁 361♥ 4🔁 0💬 0

2026-01-25

Anthropic 这篇博文揭示了一个重要趋势：

与其为每个领域构建专用智能体，不如打造通用智能体，再为其配备专业化的「技能包」（Skills）。

这就好比 Claude Code 作为通用的 Agent OS，而 Skills 则是运行在这套系统上的应用程序。AI 时代的软件工程师需要掌握如何编写 Skills —— 这意味着学会组织 Prompt（LLM 的编程语言）、传统脚本，以及领域 Assets。

https://t.co/6gq0QdGniN

👁 410♥ 4🔁 0💬 0

2026-01-24

不久前还是人类大危机「疫情时代」
没想到紧接着这么快就到人类大突破「AI 时代」

👁 278♥ 0🔁 0💬 1

2026-01-18

貌似在 𝕏 上没看到有人提到 MiniMax 前几天开源的 OctoCodingBench（编程智能体指令遵循基准）评测。

简单讲，就是 MiniMax 定义了一套 Coding Agent 指令集，然后评测了下各大模型的全部通过率（ISR），和通过数量占比（CSR）。可以看到即使是最强的 Claude 4.5 Opus 的全部通过率依然只有 36.2%。

这其实验证了 Rule 并不是写得越多越好，Context 保持精简和准确依旧是必杀技。Dynamic Context / Context Engineering 的含金量在持续上升。

👁 845♥ 6🔁 0💬 0

2026-01-17

来个暴论：未来 99% 的代码都将是开源的。

因为软件的代码会比白菜还便宜。软件的价值将来自于其他地方（数据、资源、服务能力等

👁 565♥ 0🔁 0💬 0

2026-01-16

很有趣的思路！让我想起 Emscripten 用 IndexedDB 模拟 FileSystem 的设计 😆

不过这里有个权衡：当数据以特定结构存入 DB 后，Agent 按照约定去访问应该没问题，但第三方工具 / 应用又该如何访问？放弃通用的 FileSystem，也就意味着失去了与生态系统中无数外部工具的互操作性。

或许可以换个角度思考：能否构建一个工具，为 FileSystem 提供类似 SQL 的强大检索能力，然后开放给 Agent 使用？这样既保留了兼容性，又增强了查询能力 😁

lcomplete @xlcomplete
有趣，太有趣了。

这个思路太棒了，让 Agent 访问数据库比访问文件系统更高效。

一看到这条推文，我的脑回路立刻就被激活，思路一下子打开了。

1、很早之前就被 Agent 从数据库查数据的能力给震惊过，Agent 只要能连对应的数据库，不需要提供表名等信息就能找到你想要的东西，也能轻松搞定数据统计和分析。
2、我在实现 huntly 的知识库对话功能时想过两个方案：markdown 和 mcp，却从来没想过让 agent 直接去数据库里查。

要让「知识库对话」更顺畅一些，只需要再结合时下流行的 skills，写一个 markdown，大致让 AI 知道 huntly 数据库是干嘛用的，以及一些关键数据要怎么查询就可以了。

换个角度，整个事情变得如此简单。

用我最近常说的句式来收尾，huntly 的含金量又变高了。😋

👁 441♥ 5🔁 0💬 0

2026-01-13

补充下 Nano Banana 给的配图。

可以看出 CC 在架构设计上也并非凭空捏造，而是贯彻 Unix 哲学精髓，建立在几十年操作系统设计的智慧之上的。这也奠定了它能成为一个通用 Agent Runtime 的基础。

从最早社区有大量用户把它用于代码以外的任务，到官方就后续推出的 Agent SDK 和 Cowork，也都证明了 CC 的通用能力到底有多强。

👁 351♥ 0🔁 0💬 0

2026-01-12

发现了一些 Claude Code 隐藏的设计哲学！

最近 Claude Code 的更新，给 Skill 新增了 context:fork 的配置。相信各位对计算机科学有了解的话，应该对「Fork」这个词不陌生。如果你顺着这个词去发散的话，是不是会发现：

1️⃣ Skill 的 Context Fork 是不是有点类似「创建新进程」。而 SubAgent 运行时上下文隔离，是不是也和 OS 的进程隔离类似呢。
2️⃣ 那 Skill 岂不就是「应用」！文件夹就是资源包 (Assets)，Prompt 是业务逻辑 (Logic)，里面还封装了应用配置和数据。既可由用户手动运行，亦可被 Agent 自动调度。

这不妥妥的就是一个 Agent OS 么！

👁 2,486♥ 7🔁 0💬 1

2026-01-11

Bash is all you Need.

LLM 本身就很适合作为一个 Bash 工具，输出输出都是文本流，可以很方便的与其他 Bash 工具 Pipe 串联起来。

Claude Code 的理念就像是给 Agent 提供一个可操作的 Unix 系统环境，让它能拟人化的借助 File System, Bash Scripts/Tools 等这些「外部触手」自主解决复杂的问题。

宝玉 @dotey
“你们应该多用 Bash。”

过去几周，Anthropic 的 Thariq 和几十家做通用智能体的公司开了电话会议。邮件助手、客服机器人、日程管理——各种产品形态都有。聊完一圈，他发现自己反复在说同一句话。

Bash？那不是程序员用的命令行工具吗，和这些产品有什么关系？

先看一个具体场景。

假设你有一个邮件 Agent，你问它：“这周我在打车上花了多少钱？”

传统做法是这样的：Agent 调用 API 拉取邮件，可能一次性取回 100 封，然后让模型从里面找 Uber、Lyft 的收据，加总金额。

问题在于 100 封邮件塞进上下文，模型要同时记住这些内容，从中筛选、计算。这对大语言模型来说并不轻松。容易漏，容易错，而且你没法验证它到底看了哪些邮件。

这就是典型的模型舒适区问题：数据量不算大到需要专门写程序处理，但又超出了模型一次性硬算的能力范围。夹在中间，很尴尬。

Thariq 的方案是：给 Agent 一个 Bash 工具，让它把中间结果存成文件。

听起来很简单，但背后的逻辑很有意思。

传统的工具调用是这样的流程：

工具 → 模型处理 → 输出结果

所有中间状态都在模型的“脑子”里，你看不见，也没法检查。

换成 Bash 之后，流程变了：

工具 → 存文件 → 搜索/过滤 → 模型处理 → 输出结果

模型可以先把 100 封邮件存到一个文件里，然后用 grep 搜“Uber”，再 grep“Lyft”，分别统计。每一步都有迹可查，最后加总的时候，它还能回头检查自己的中间结果。

这带来三个能力升级：

可复现。同样的命令再跑一遍，结果一样。你可以调试，可以排查问题。

可验证。模型不是凭“记忆”给你答案，而是基于实际文件里的数据。你信不过的话，自己也能打开文件看一眼。

可组合。一个命令的输出可以作为下一个命令的输入，管道一接，复杂任务就能拆成简单步骤。

Bash 让 Agent 从“脑算”变成了“打草稿”。草稿可以留痕，可以检查，可以改。这对需要准确性的任务来说太重要了。

邮件搜索只是最直观的例子。Bash 的能力边界其实很宽。

链式 API 调用是个常见需求。比如“把这周我发过邮件的联系人都找出来”，这需要先拉邮件列表，提取收件人，去重，再逐个查询联系人详情。一连串操作用 Tool calls 来做，调用次数多，中间状态难管理。用 Bash 脚本串起来，逻辑清晰得多。

视频和文件处理也是 Bash 的强项。ffmpeg 这个命令行工具，模型用起来得心应手。找视频里某个片段、裁剪、转码，一行命令搞定。

还有定时任务。在 Agent 运行的容器里，用 cronjob 或 at 命令就能创建定时执行的任务。用户说“每天早上 8 点给我发一份新闻摘要”，Agent 可以自己设好闹钟。

这些场景有个共同点：都需要多步骤操作，都需要保存中间状态，都超出了单次工具调用的能力范围。

但 Bash 是把双刃剑。

能执行命令意味着能做很多事，也意味着能做很多危险的事。rm -rf 一不小心就能删光整个目录。如果 Agent 被恶意提示词攻击，后果可能很严重。

Anthropic 显然考虑到了这一点。他们在 Claude Agent SDK 里做了一套权限系统，包括 Bash 命令解析器和分级权限控制。哪些命令可以直接执行，哪些需要用户确认，哪些完全禁止，都可以配置。

我用 Claude Code 的体会是，这套权限系统确实降低了心理负担。它会在执行敏感操作前询问你，而不是闷头就干。但安全护栏不是万能药。权限系统本身也可能有漏洞，Bash 解析器也可能被绕过。

安全护栏是必需品，但不能因此就觉得万事大吉。

强调 Bash 的好处，也得说清楚它的边界。

如果任务足够简单，别用。“今天天气怎么样”这种一次性查询，直接调 API 返回结果就行，没必要存文件再处理。杀鸡用牛刀反而更慢。

如果环境是 Serverless 的，用不了。很多云函数运行时没有可持久化的文件系统，Bash 的“存中间结果”优势就没了。

如果对安全要求极高，谨慎使用。命令注入的风险无法百分之百消除，金融、医疗这类场景可能更适合用白名单式的专用工具，而非通用的 Bash。

工具的选择取决于场景，而不是工具本身的强弱。Bash 很强，但不是所有场合都该用。

回过头看，Thariq 这条建议的真正价值不是“Bash 很强”这个结论，而是背后的思维方式：

让 Agent 的思考过程“落地”到可检查的中间产物。

传统的 Agent 设计把所有东西都塞进模型的上下文，一锤子买卖。Bash 提供了另一种路径：把复杂任务拆开，每一步都留下痕迹，可以验证，可以回溯。

想想看，这和人类处理复杂问题的方式多像。我们做复杂计算时会列竖式，写长文章时会先拟提纲，处理大量信息时会做笔记。不是因为脑子记不住，而是因为落到纸上更可靠、更容易检查。

Agent 也一样。不是说模型处理不了，而是有中间产物的流程更值得信任。我自己用 Agent 辅助写作，所有中间产物都会存成文件：网络检索资料、提纲、不同版本的草稿、画图的提示词。这些存下来后续就可以灵活组合。

Bash 不只是程序员的工具，更是让 Agent 具备可验证、可复现、可审计能力的关键一环。

👁 518♥ 5🔁 0💬 0

2026-01-10

这不正说明了 Claude Code Agnet 的内部架构足够复杂，再相似的概念可能也会有不少细微的差别。也印证了「Context Engineering」到底能做到有多深 🤣

我个人是认同 Anthropic 创造的这些概念的，这些概念实际在规范、指导普通人如何更好的控制一个复杂的 Agent 系统，其实是在降低大家的门槛。

Yumin @YuminAI
Anthropic这帮人是有病吧
他们发明了plugin, agents, skills
但这不都是一堆markdown文件吗
为什么还区分那么多？

无非都是prompt
ok，有些prompt可以被重复使用
但你也不致于发明这么多概念啊

你就老老实实的说
这个是做ui的prompt
这个是做code review的prompt
这个是做web search的prompt ，但你可以同时开多个进程来跑这个prompt

我他妈还寻思这都是什么高科技呢
天天装神弄鬼，也不学点好

👁 698♥ 6🔁 0💬 0

2026-01-07

即便在 Vibe Coding 时代，主动管理 Context 依然是高级工程师的分水岭。分享几个 Claude Code 实战心得：

1️⃣ 果断新开 Conversation：无论任何时候，重开是让 AI 「重新聚焦」最快的方式，可以避免幻觉积累。
2️⃣ 手动 /compact：在维持一定上文的同时，减少一些噪音。
3️⃣ 善用 /export：将高质量 Context 持久化，实现跨 Conversation 的记忆共享。

保持 AI 聚焦，是 AI 时代程序员的新基本功。

👁 439♥ 3🔁 0💬 0

2026-01-06

截至目前为止，已收到过上百封网友来信，提出了各种问题和需求。但作为免费的业余项目有时难免力不从心啊 😅
这个项目我主要还是用来研究 Next.js & Emscripten 的（感兴趣的可以访问下试试，感受下 Next.js 极致优化下的体验），目前的成功只能说是个副产品。

👁 635♥ 5🔁 0💬 0

2026-01-05

如果你还在自己从零搭建 Agent，不妨换个思路：直接用 Claude Code 来设计和验证你的 Workflow。
Claude Code 本质上是一个通用的 Agent Runtime，远不止是代码工具。它集成了行业标准能力：

Skills - 渐进式披露的领域知识
MCP - 连接任意外部工具和系统
Subagents - 上下文独立的子任务分解能力
Hooks - 在关键节点注入自定义逻辑

用它快速完成 Workflow 设计和测试，验证可行后再用 Claude Agent SDK 封装成产品级方案。这条路径既能借力业界最强的 Agent 能力，又能保持架构的灵活性。

👁 373♥ 5🔁 0💬 0

2026-01-04

Spec-Driven Development 就跟 Java 设计模式一样，又长又臭，有点用，但用（/写）得太多是反作用。大多数人掌握不好那个度，容易陷进过度设计的陷阱。

就如我之前提到的 JIT Context。现在优秀的 Context Engineering 都是围绕着「如何构造最有价值的上下文」来设计的，要让每一个 Token 发挥最大的价值。但现在大多数人所谓的 Spec-Driven Development 明显是反模式的，把一堆文档丢给 LLM，大量的「规则」反而会影响 LLM 的注意力和遵循能力。

真正要用好 Spec-Driven Development 的话，一定是要模块化、渐进式的。把需求拆分成多个模块、计划，每一步再单独进行 Spec-Driven。

宝玉 @dotey
我个人不喜欢 Spec-Driven Development，有点像瀑布模型写系统设计文档，理论上看起来很牛，但是并不好操作，另外容易想的太多。

我比较推崇小版本迭代，不需要写详细的 spec，几句简单的 prompt 就可以开始生成，每次写一个可以跑起来的版本，然后一点点迭代，每次迭代完都是可以运行的版本

另外大多数时候，Claude Code 的 Plan Mode 就足够好用了，根据你当前想实现的，会写一个 plan 文档，可以反复沟通确认。

👁 10,316♥ 38🔁 5💬 5

2026-01-03

这几天，在我们这三线城市（深圳旁的一个小城市）又入手了套房。
业主是深圳的，这房子她刚好高峰期「投资」的，当时单价接近两万，现在同户型最新成交一万不到，刚好「腰斩」。
和她电话沟通谈价时，她说这地方现在就是她的伤心地，赶紧脱手卖了以后再也不来这地了。

👁 987♥ 2🔁 0💬 1

2026-01-02

坚持和 AI 进行「反复、深度讨论」，而不是简单的拾人牙慧。

👁 220♥ 1🔁 0💬 0

2026-01-02

最可怕的不是 AI 会思考，而是人类放弃思考。把 AI 当外脑没问题，但别让它成为唯一的大脑。

👁 324♥ 1🔁 0💬 1

2026-01-01

当初 FTX 的统一保证金体系也是独一档的。虽然倒闭让我的资金打了水漂，但比起金钱损失，更让我难受的是一个这么出色的产品就此成为历史。

Benson Sun @BensonTWN
FTX 倒了三年了。

撇開 SBF 做的那些事不談，純粹從產品角度來看，FTX 很多功能放到現在依然能打，甚至領先現在多數交易所。

子帳號系統到現在沒有任何一家做到類似體驗。FTX 的子帳號是原生帳號架構，不是那種層層疊疊、權限綁手綁腳的設計。開一個子帳號就像開一個全新帳戶，乾淨俐落。

美股代幣FTX 上輪週期就在做了。這輪才開始有交易所把這當賣點來宣傳，晚了一整個週期。

Quant Zone 更是一絕。不用寫程式就能建立自動化策略，我以前做套利都直接開 Quant Zone 跑，省下大量開發時間。

其他產品還包括指數合約、槓桿代幣，以及當時全網唯一的每小時結算、無cap 的資金費率，和 RFQ 的 OTC desk。

FTX 的產品設計確實超前了這個行業一整個週期。三年過去了，如果 SBF 沒作惡，如果 FTX 還在，我相信還會引領更多 CEX 的創新，真的可惜了。

👁 360♥ 0🔁 0💬 0