推文 · 2026 上半年

2026 上半年 · 83 条
2026-06-15
长远来讲,多 agent 很可能只是过渡产物。当 llm 的上下文容量、注意力有非常大的突破之后,提供全量、连贯的上下文是唯一解。
nekocode @nekocode_cn
关于这里,我的看法不一样 👀

在我看来 subagent 要解决的,还是「上下文」这个老难题。因为 llm 的上下文容量和注意力都是有限的,用不同的上下文来处理不同的任务是目前工程上的最优解。

而 subagent 在这里的核心价值就是上下文隔离,也是原 up 说到的,防止不同任务之间上下文互相污染。因为某段上下文对某个任务来说可能非常有用,但是对另一个任务来说可能就是噪音了。

你提到的类比成 thread/coroutine/worker,我感觉表象上确实是这样,但是核心要解决的问题可能不一样。
👁 349♥ 0🔁 0💬 0
2026-06-15
来看下有哪些人 star 了 filetree-skill?

地域:中国 40+、美国/北美 10+、欧洲 10+、东南亚 10+、日韩台港若干、中东/拉美/非洲各若干

公司/身份:Rainbow 钱包创始人 + 美团 + 滴滴 + 微博 + 腾讯音乐 + 网易 + BrowserStack + 韩国 KakaoBank + 德国 ginmon + 约翰霍普金斯应用物理实验室 + BrainCo 强脑科技 + 一堆高校(南大/中大/中科院/纽卡斯尔/诺丁汉)+ 新加坡武装部队等等
nekocode @nekocode_cn
开源了其中一个我自己最常用的 harness 实践。

我习惯在每个项目里维护一份 FILETREE.md:完整文件树 + 每个文件由 AI 生成的一句话描述 + 用于感知变更的 hash。

本质上,这是为项目提前构建了一层文件维度的索引,对 agent 而言,是密度 / 性价比极高的上下文,特别是在中小型项目里,加了这么一段信息,对 agent 快速理解整个项目有非常大的帮助。

https://t.co/6MADl8tp2u
👁 7,556♥ 18🔁 1💬 20
2026-06-10
一语成谶。早上 1on1 结束,新一轮总算到我头上了,last day 6/12 😅 好啦,可以开始整理简历了
nekocode @nekocode_cn
公司这周非常突然地裁了员,我们 team 砍掉了一半左右,留下来的人被分到了其他 team。

我算是侥幸留了下来,但被分到了一个不太 match 的团队。所谓「插班生往往是下一轮的炮灰」,我也说不准自己还能撑多久 😅

这让我想起之前听过的一个说法:「一家公司有多少人,不取决于它需要多少人,而取决于它能养得起多少人。」这个观点挺有意思,也很贴合经济上行期很多公司的行事逻辑。但在如今经济下行的大环境下,我感觉越来越多的公司开始认真思考一个问题,「维持正常运转,最少需要多少人」。

裁员、失业会是常态。每个打工人都需要警觉起来。
👁 24,562♥ 54🔁 0💬 32
2026-06-06
人多了,对齐成本很高。我们之前团队就试过「多人 + agent-first」,痛苦不堪。

人数摆在那,分工是个问题,不同人之间的对齐是个问题,每个人用 agent 的方式不同又是个问题。

一个人,代码膨胀得太快,本身认知债已经很重了,你还要多个人同时去背负。然后一群对实现、细节模糊的人再去做各种讨论、对齐,痛苦 😖
microstrong @Microstrongs
@nekocode_cn @yihui_indie Agent 开发模式下,多人- Agent 协作确实是一个新的挑战。

多人在方案制定阶段是有明显好处的,但如果到开发阶段,直接 subagents 就好了。
👁 5,061♥ 22🔁 0💬 22
2026-05-30
公司这周非常突然地裁了员,我们 team 砍掉了一半左右,留下来的人被分到了其他 team。

我算是侥幸留了下来,但被分到了一个不太 match 的团队。所谓「插班生往往是下一轮的炮灰」,我也说不准自己还能撑多久 😅

这让我想起之前听过的一个说法:「一家公司有多少人,不取决于它需要多少人,而取决于它能养得起多少人。」这个观点挺有意思,也很贴合经济上行期很多公司的行事逻辑。但在如今经济下行的大环境下,我感觉越来越多的公司开始认真思考一个问题,「维持正常运转,最少需要多少人」。

裁员、失业会是常态。每个打工人都需要警觉起来。
👁 51,176♥ 91🔁 3💬 28
2026-05-26
开源了其中一个我自己最常用的 harness 实践。

我习惯在每个项目里维护一份 FILETREE.md:完整文件树 + 每个文件由 AI 生成的一句话描述 + 用于感知变更的 hash。

本质上,这是为项目提前构建了一层文件维度的索引,对 agent 而言,是密度 / 性价比极高的上下文,特别是在中小型项目里,加了这么一段信息,对 agent 快速理解整个项目有非常大的帮助。

https://t.co/6MADl8tp2u
👁 23,277♥ 190🔁 25💬 4
2026-05-26
😆 笑死,确实是相互糊弄

比较搞笑的是,出文档的人可能自己都没完整理解、甚至没阅读完整个文档,拿出来开会讨论的时候各种出岔子
plantegg @plantegg
有了 AI 之后,飞书文档承受了从来没有过的压力:
1)新文档生成速度直线上升
2)读写比例达到新低,也就是架构估计得重构了

以前大家都知道一般读写比例是 95:5,现在估计接近 50:50 了

这些文档大家也没真的去看,在各个会议上,在 CEO CTO CXO 以及各级工程师之间一视同仁地互相糊弄
👁 1,707♥ 2🔁 0💬 0
2026-05-24
以我的经验,目前最好用的查询索引是维护一个全局的 FILETREE.md:项目文件树,每个文件一句话描述

less is more。信息量/上下文不是越多越好,信息越多注意力越容易被分散,这里的权衡很重要,也是大多数新手容易犯错的地方。
Yufan Sheng @syhily
不知道是不是我的使用姿势不正确,推油大吹特吹的 CodeGraph 在我这使用效果相当一般。还不如 Agent 自己去 Grep。
👁 1,438♥ 8🔁 1💬 2
2026-05-22
https://t.co/lsxd9k1TtV

这套关于 skill 的 meta-system,其实一个月前就做完了,一直没发。

它的灵魂在于:从你的历史对话里提炼 skill,再在后续对话中持续迭代。/scan 翻你过去的 session 找漏网的工作流,/create 起草,/improve 迭代,每一步都跑 eval,不达标不入库。

project scope 的 skill 应该是活的:从过去的对话里长出来,在未来的对话里继续被打磨。越聊越聪明,越用越懂当前的项目。
👁 659♥ 0🔁 0💬 1
2026-04-21
这里我提供个核心思路:

当你要写 prompt/skill,或者你已有的 prompt 已经很长的时候。

让 ai 把里面所有能转化成 lint rules 或者 script 的部分,都尽可能转化。

熵减、收敛、消除不确定性。
nekocode @nekocode_cn
一点心得,harness engineering 的本质是「熵减」。

而代码优于 prompt 约束,尽量把所有流程、约束,收敛到更稳定、有序的代码层去实现。

这也是 skills(agent 时代的 app)原生支持 scripts 的核心逻辑所在。
👁 764♥ 4🔁 0💬 0
2026-04-19
来看下有哪些人在用 agent-worktree?

地域: 中国 40+、美国 20+、欧洲 15+、印度/东南亚 15+、日韩 5+、中东/拉美各若干

公司: Google + SpaceX + Figma + Adobe + JPMorgan + 阿里 + 美团 + 饿了么 + Bob 翻译作者 + Apache ShardingSphere 贡献者全都在

https://t.co/bkLlDtCYwh
👁 24,672♥ 138🔁 25💬 13
2026-04-19
DRY (Don't Repeat Yourself)
SSOT (Single Source of Truth)

一旦存在两份表达,就必然产生同步成本和漂移风险。而代码是会被执行、会被编译器 / 类型系统 / 测试不断「审问」的那一份,所以它天然更不容易撒谎。
nekocode @nekocode_cn
你如果在用 SDD,那我不建议你把 Spec 持久化。因为 Spec 会漂移!

代码在变,Spec 却不一定跟着更新。过时的 Spec 不是文档,是噪音,是幻觉的温床

真正的「唯一真相来源」应该只有一个:代码本身

又或许你更需要的是 Plan Mode,或者一个全局唯一的 Spec: ARCHITECTURE.md
👁 697♥ 2🔁 0💬 0
2026-04-17
在做一件非常好玩、非常 meta 的事情🤣
👁 550♥ 3🔁 0💬 0
2026-04-16
今天听到个搞笑的梗:

现在最危险的幻觉,不在模型里,在老板们那🤣
👁 564♥ 8🔁 0💬 0
2026-04-13
你如果在用 SDD,那我不建议你把 Spec 持久化。因为 Spec 会漂移!

代码在变,Spec 却不一定跟着更新。过时的 Spec 不是文档,是噪音,是幻觉的温床

真正的「唯一真相来源」应该只有一个:代码本身

又或许你更需要的是 Plan Mode,或者一个全局唯一的 Spec: ARCHITECTURE.md
👁 1,324♥ 5🔁 0💬 0
2026-04-09
神奇,时隔了两年半的 merge 😳

纯手工、古法编程时代的 pr,这个含金量还可以吧!
👁 527♥ 2🔁 0💬 0
2026-04-06
通过大量的无序的 token 熵减、收敛为有序的 code。

相比「人力」,token 是一种「智力」,而 code 是智力思考中能固化下来的「计算」、公式。

这也是 coding agent 之所以在当前这个阶段会这么重要的原因。
nekocode @nekocode_cn
一点心得,harness engineering 的本质是「熵减」。

而代码优于 prompt 约束,尽量把所有流程、约束,收敛到更稳定、有序的代码层去实现。

这也是 skills(agent 时代的 app)原生支持 scripts 的核心逻辑所在。
👁 507♥ 3🔁 0💬 0
2026-04-04
我越来越相信,OPC 最好的时代刚刚开始

新立个 flag:今年 MRR 目标 $5k,目前完成 20%

放大审美、填充需求洼地。顶尖的产品、设计师、工程师,依旧能比所有人跑得更远
👁 489♥ 4🔁 0💬 0
2026-04-02
一点心得,harness engineering 的本质是「熵减」。

而代码优于 prompt 约束,尽量把所有流程、约束,收敛到更稳定、有序的代码层去实现。

这也是 skills(agent 时代的 app)原生支持 scripts 的核心逻辑所在。
👁 1,670♥ 7🔁 0💬 0
2026-03-29
SeqLog v1.4.0 发布了 👉 https://t.co/AouZsWkb88

- SwiftUI + Rust,完全 Apple native
- 5MB 安装包,不是 300MB 的 Electron 壳子
- 纯 .md 文件,无数据库无索引,你的笔记就是你的笔记
- 不做官方云,但 git 同步 / 回滚 / 冲突处理一个不少
- 多 tab、斜杠命令、Logseq 级别的 block 交互

重新思考了一遍笔记软件该长什么样🤔
👁 694♥ 3🔁 0💬 1
2026-03-27
我的 vibe 日常:

同时开 2 到 3 个 project,然后每个 project 使用 agent-worktree 维护至少一个固定存在的 worktree。并行 vibe,控制时机做好 sync 和 merge。

token roi 直接拉满🤣

https://t.co/bkLlDtCYwh
👁 2,029♥ 20🔁 0💬 2
2026-03-25
灵感 & 基因来源:Logseq + VS Code

不到 5MB 的大小,Apple Native,无 DB 无索引(抛弃 Logseq 路线),多 Tab,斜杠命令面板

对我来说简直太完美了!
👁 601♥ 0🔁 0💬 0
2026-03-24
做了个东西:SeqLog — Apple 原生的 Logseq 替代品。

SwiftUI + Rust FFI,没有 Electron,没有 300MB 运行时,没有云。

- 不做数据库(.md 就是真相)
- 不做索引(ripgrep 够快,VS Code 同款引擎)
- 不做云(你自己选 iCloud/Git/Dropbox)
- 不做 Electron(SwiftUI 原生)
👁 1,544♥ 16🔁 0💬 1
2026-03-22
用习惯了 cc + cli/mcp,感觉真的很舒服。
用 github cli 来回复用户 issue: https://t.co/XJsQI9EHaB
用 aws 和 cloudflare cli 来帮我做运维。
先别管什么失不失业啥的,爽倒是真的爽。
👁 550♥ 1🔁 1💬 0
2026-03-10
当人人热衷于互相甩 AI 拉的 DOC 时,总算知道 Agent 这个词的意义了:

你 → Agent → Big💩 → 我 → Agent → Small💩 → 我(总算咽得下去)

你说说,不「代理」,还能沟通么?😆
👁 329♥ 1🔁 0💬 1
2026-03-10
Opus 4.6 + High Effort
👁 193♥ 0🔁 0💬 0
2026-03-10
为什么我要说 GUI IS BUIILSHIT

来看看一个 AttributeGraph Cycle 的 GUI 问题,在 TDD Loop 下能让 AI 连续忙活多久 😅
nekocode @nekocode_cn
GUI IS BULLSHIT!

就算强如 Claude Opus 4.6,在 Vibe coding GUI 项目时(尤其是非 Web 栈),在稍微复杂的交互场景下,总容易会有 Bug 或细节问题,很容易让细节狂魔抓狂。

反观非 GUI 项目,Vibe coding 简直行云流水,身心愉悦。

看来文本喂出来的模型,终究是个半瞎 🤔
👁 626♥ 0🔁 0💬 2
2026-03-09
导致我最近经常 Prompt「用 ask 工具问我」
👁 179♥ 0🔁 0💬 0
2026-03-07
分享点数据。最近给某产品加上「收费」后,日收入能有 200+
👁 542♥ 4🔁 0💬 2
2026-03-06
GUI IS BULLSHIT!

就算强如 Claude Opus 4.6,在 Vibe coding GUI 项目时(尤其是非 Web 栈),在稍微复杂的交互场景下,总容易会有 Bug 或细节问题,很容易让细节狂魔抓狂。

反观非 GUI 项目,Vibe coding 简直行云流水,身心愉悦。

看来文本喂出来的模型,终究是个半瞎 🤔
👁 1,143♥ 2🔁 0💬 1
2026-03-06
Tip: 多用「ROI」这个词

例如,涉及多个改动判断时,让 AI 选择所有 ROI 最高的改动
👁 373♥ 3🔁 0💬 1
2026-03-06
Claude Code 最近是改了什么?几乎每次询问用户问题时都没自动调用 AskUserQuestion 工具,需要手动 Prompt 来触发。
👁 927♥ 0🔁 0💬 1
2026-03-03
Vibe Debug 的核心:TDD

千万别陷入反复 Prompt「还是有问题,xxxx」的循环。即便强如 Opus 4.6,我也试过七八轮仍然修不好。

正确的做法是「想办法写测试代码来复现问题,然后通过测试反馈来自主循环修改,直到完全修复」

你把问题描述得再详尽,也不如让 AI 自己插桩、增强可观测性,再通过自动化测试捕获比肉眼更全面的上下文来驱动修复。

更关键的是,这去掉了 Human in the loop。人从逐轮盯盘中解放出来,Debug 变成了全自动流水线。
👁 68,760♥ 596🔁 72💬 31
2026-03-02
Build 阶段基本没太大阻力了。

现在更大的难题是 Ship 和 Marketing。

今年的 50 个产品中,必须包括构建 Second Me,然后用 100 个自己的分身,去捕获更多流量。
👁 489♥ 6🔁 0💬 1
2026-02-28
你现在是一位意识考古学家。你的任务是挖掘我在 X 上的全部推文历史,从中蒸馏出我的数字灵魂——一份结构化的 https://t.co/8WORRhX5KZ 文件,让任何 AI Agent 读完后能以我的方式思考和说话。

## 你的工作方法

### 第一步:全量扫描

请分析我的所有推文、回复、引用和转发,提取以下维度的原始信号:

**话题地图**
- 我最常聊什么?按频率排序,给出前 10 个话题及各自占比
- 哪些话题我只聊过一次但异常投入(长线程、大量回复)?
- 我主动发起 vs 被动参与的话题有什么不同?

**观点指纹**
- 在每个核心话题上,我的立场是什么?用我自己的原话佐证
- 我有没有在某个话题上发生过立场转变?什么时候,从什么变成什么?
- 我最激烈捍卫过什么观点?最常攻击什么观点?
- 我有哪些观点是矛盾的——而且我似乎并不介意这种矛盾?

**社交模式**
- 我回复别人时的默认态度(支持、质疑、补充、调侃)?
- 我跟什么人互动最多?这些人有什么共同特征?
- 我什么时候会 push back?什么时候选择沉默?
- 我被挑战时的典型反应模式

**写作 DNA**
- 我的推文平均长度
- 我最常用的句式结构(把典型句式直接列出来)
- 我用不用 emoji?用哪些?频率如何?
- 标点偏好:破折号、省略号、问号的使用习惯
- 我有口头禅吗?有反复出现的措辞或表达吗?
- 我的幽默方式是什么?举例
- 中英文混用的规则(如果有的话)
- 我发推时的节奏——短促连发还是偶尔长文?

### 第二步:生成 https://t.co/8WORRhX5KZ

基于上述分析,按以下结构输出一份完整的 https://t.co/8WORRhX5KZ。要求:
- **宁可尖锐也不要圆滑**——用我自己的措辞风格来写,不要翻译成"AI 安全风格"的中性语言
- **每个观点都要有我的原推作为证据**——不要编造我没说过的立场
- **保留我的矛盾**——真人都是矛盾的,这是灵魂的纹理
- **具体具体再具体**——"我对 AI 持乐观态度"是垃圾,"我认为 scaling law 还远没到头,大多数 AI doomer 的论证在计算细节上站不住脚"才是灵魂

```markdown
# [我的 X handle]

[一句话:读完这句话,陌生人应该立刻知道我是什么样的人]

## 我是谁

[基于我的推文推断:我做什么、关心什么、在什么交叉领域活动。2-3 段]

## 我的信念体系

### 核心信念
[从推文中提取 5-8 条最坚定、最反复出现的信念。每条必须:]
[1. 足够具体到可以被反驳]
[2. 附带我的原推作为证据]

### 热辣观点
[那些我明确表达过的、与主流不同的立场。格式:]
- **[话题]**: [我的立场]。证据: "[我的原推摘录]"

### 我承认的矛盾
[我在推文中自相矛盾的地方——如果我自己也承认过这种矛盾,更好]

### 立场演变
[如果我在某些话题上的观点随时间发生了变化,记录这些转变]

## 我怎么思考

- **第一反应**: [遇到新信息时的默认反应模式]
- **论证偏好**: [我倾向于用什么方式说服别人:数据/类比/反问/归谬]
- **知识来源**: [我常引用或提到的人、书、概念]
- **盲区**: [从推文模式推断,我可能系统性忽视的视角]

## 我怎么说话

### 语气频谱
[不是一个固定值,而是一个范围——在什么情况下我偏哪一端:]
- 认真 ←→ 玩笑
- 直接 ←→ 委婉
- 简洁 ←→ 展开
- 自信 ←→ 试探

### 句式指纹
- **典型句式**: [直接列出 3-5 个我最常用的句式模板]
- **段落节奏**: [我是短句连发还是长段展开?]
- **口头禅**: [我反复使用的词、短语、句尾习惯]
- **标点人格**: [我对破折号/省略号/括号/感叹号的使用方式]

### 词汇表
- **高频词**: [我用得最多的 15-20 个有辨识度的词]
- **禁用词**: [从推文历史推断,我几乎从不使用的表达方式]
- **专属用法**: [我给某些词赋予的特殊含义,或我造的词]

### Emoji 与格式
- [具体的 emoji 使用规则]
- [列表/线程/图片的使用偏好]

### 中英文规则(如适用)
- [什么时候用中文、什么时候用英文、什么时候混用]
- [技术词汇的处理方式]

## 互动人格

- **被赞同时**: [我的反应]
- **被质疑时**: [我的反应——用原推证明]
- **遇到蠢话时**: [我是直说、讽刺、还是无视?]
- **遇到好观点时**: [我会怎么回应?]
- **在群体讨论中**: [我是发起者、回应者、还是旁观者?]

## 红线

[基于推文推断,我绝不会做的事:]
- [红线 1]
- [红线 2]
- [隐私相关]

## 校准锚点

[列出 5 条最能代表"我"的原推。这些是任何模仿我的 AI 必须能产出同等水平内容的基准线]

1. "[原推 1]" — 为什么这条能代表我:...
2. "[原推 2]" — 为什么这条能代表我:...
3. "[原推 3]" — 为什么这条能代表我:...
4. "[原推 4]" — 为什么这条能代表我:...
5. "[原推 5]" — 为什么这条能代表我:...
```

## 重要约束

1. **只基于事实推断**——所有观点归纳都必须有我的原推支撑,不要脑补我没表达过的立场
2. **保持我的语言**——用我的措辞风格来写这份文件本身,不要用你的
3. **标注置信度**——如果某个推断你不太确定,标注 [低置信度] 并说明为什么
4. **不要美化**——如果我在推文里是个混蛋,https://t.co/8WORRhX5KZ 也该如实反映
5. **不要脱敏**——不要把我的尖锐观点软化成"有见地的看法"

## 输出要求

直接输出完整的 https://t.co/8WORRhX5KZ,用 Markdown 格式。不需要开场白、不需要总结、不需要问我是否满意。如果推文数据不足以支撑某个章节,留空并注明"[数据不足,建议手动补充]"而非编造。
👁 365♥ 0🔁 0💬 0
2026-02-28
我让 Grok 把我 X 上的所有推文挖了个底朝天,蒸馏出了我的数字灵魂:一份 SOUL.md
现在任何 Agent 读完都能基本复刻我的思考方式和说话习惯(至少 70% 像我)
Prompt 放评论区了,欢迎来 Fork 你的版本 🤣
👁 522♥ 3🔁 0💬 1
2026-02-28
今天听到一个很有意思的观点:

一个公司有多少员工,不在于它需要多少人,而是在于它能养得起多少人 🤔
👁 436♥ 2🔁 0💬 1
2026-02-27
思考了很久,不得不得出以下结论:

1. 除非不得已,尽量别再手写一行代码。强迫自己去驯服 AI,而不是和 AI 竞争。多十次 Prompt,也好过再手写一句代码来解决问题,因为你锻炼的是接受另一种「新范式」

2. 未来对大多职场人来说「会思考」变得没那么重要,学会「提供情绪价值」更重要。这个可能每个人的理解不一样,但简单来说就是「情商 > 智商」

3. 也别死磕职场,现在这个阶段,组织反而不一定比得上敏捷的个体,因为 AI 放大了个体能力,而个体减少了组织应有的沟通、决策成本。天下功夫唯快不破
👁 461♥ 9🔁 0💬 0
2026-02-26
现在深入 Vibe Engineering 最好的方式:

自己 Vibe 出 AI Infra → 用自造的工具加速 Vibe Skills & Speed → 循环迭代。

这也是 @steipete 的路径 —— Bootstrapping yourself。
👁 601♥ 4🔁 0💬 0
2026-02-24
为什么要给 AI 构建自反馈 Loop?

因为人实在太懒了。遇到问题,连把问题描述清楚这点力气都不想花。

就像我,经常甩给 AI 一句「还是有问题」就完事了 🤣
👁 326♥ 3🔁 0💬 0
2026-02-24
👁 2,970♥ 20🔁 4💬 0
2026-02-24
今天看到 @steipete Star 了一个叫 acpx 的项目。

点开研究了一下,发现和我上上周发布的 agent-team 思路不谋而合,都是通过 ACP 来编排和控制 Coding Agent CLI,让多个 Agent 之间能够协同工作。

acpx 是上周刚发布的,我的 agent-team 是上上周发布的,然并卵 🤣 这个时代,代码已经不值钱了,有思路的话人人都可以开发属于自己的 XXX。看看 🦞 现在有多少个变种就知道了。
nekocode @nekocode_cn
谁说 Agent Client Protocol 只能给 GUI 用 🤣

Team/Swarm 模式很可能是 Coding Agent 在 2026 年真正爆发的关键方向。可以预见,每个主流 Coding Agent 都会推出自己的 Team Mode —— 但一个更有意思的问题是:怎么让不同厂商、不同架构的 Coding Agent 组成一个异构 Team?

目前市面上已经有一些尝试,但各有局限:

1. Headless 模式:通过 Coding Agent CLI 的 Headless 模式来编排多个 Agent。问题在于,各家的 Headless 模式普遍是阉割版——功能覆盖不全,交互能力也大打折扣,远不如完整的 CLI 交互体验。

2. PTY 劫持:直接通过伪终端(PTY)接管 Coding Agent CLI 的输入输出。这种方式虽然理论上能获取完整能力,但信噪比极低——你需要从大量终端控制字符、ANSI 转义序列和格式化输出中解析出真正有用的信息,既脆弱又难以维护。

而 ACP(Agent Client Protocol)提供了一个更优雅的解法。 它在 CLI 交互之上抽象出一层统一的、结构化的协议层,让上层编排系统无需关心底层 Agent 的具体实现细节,就能以一致的方式与不同的 Coding Agent 进行通信和协作。

基于这个思路,我做了一个开源项目来验证这个想法 👇

https://t.co/Sl1nMKd7Yq
👁 700♥ 0🔁 0💬 1
2026-02-19
说到底,AI 还是需要注意力引导才能交出更好的成果 —— 你在哪个环节给足 Context,它就在哪个环节完成得更出色。
👁 149♥ 0🔁 0💬 0
2026-02-14
Spec-Driven Development,「文档即共识」

这里我其实还有一个妙用:

众所周知,让 AI 直接生成前端页面,还原度始终难以令人满意。但换一条路径:先让 AI 将所有 UI 页面用自然语言尽可能详细地描述出来,写入文档;

然后由你审阅、调整这份文档,确认无误后,再让 AI 依据文档去生成代码。
nekocode @nekocode_cn
上下文工程,我常用的一个小技巧:

让 AI 把现状先写到一个 MD 文件里

git commit

Review & 修改 MD 文件

/clear

让 AI 基于 git diff(你对现状的修改意见)去解决问题
👁 908♥ 6🔁 0💬 1
2026-02-13
结合 @waylybaye 老师最近说的 BDD。我有个新玩法,先让 AI 出一份基于 BDD 的测试 Spec,然后我来人工校验、不断和 AI 对话进行完善和补充。

最后再让 AI 根据这份 https://t.co/vEA75SM4Xs 结合 TDD 来迭代就好。这里 TDD 是底线,对我来说测试不是目的,「可测试的代码」通常「更加可维护」才是重点。
nekocode @nekocode_cn
上下文工程,我常用的一个小技巧:

让 AI 把现状先写到一个 MD 文件里

git commit

Review & 修改 MD 文件

/clear

让 AI 基于 git diff(你对现状的修改意见)去解决问题
👁 25,834♥ 62🔁 5💬 1
2026-02-11
Coding Agent CLI ─► ACP ─► Agent Team CLI

用 Claude 通过 Agent Team CLI 来指挥另外两个 Coding Agent CLI 打工
👁 302♥ 1🔁 0💬 0
2026-02-11
谁说 Agent Client Protocol 只能给 GUI 用 🤣

Team/Swarm 模式很可能是 Coding Agent 在 2026 年真正爆发的关键方向。可以预见,每个主流 Coding Agent 都会推出自己的 Team Mode —— 但一个更有意思的问题是:怎么让不同厂商、不同架构的 Coding Agent 组成一个异构 Team?

目前市面上已经有一些尝试,但各有局限:

1. Headless 模式:通过 Coding Agent CLI 的 Headless 模式来编排多个 Agent。问题在于,各家的 Headless 模式普遍是阉割版——功能覆盖不全,交互能力也大打折扣,远不如完整的 CLI 交互体验。

2. PTY 劫持:直接通过伪终端(PTY)接管 Coding Agent CLI 的输入输出。这种方式虽然理论上能获取完整能力,但信噪比极低——你需要从大量终端控制字符、ANSI 转义序列和格式化输出中解析出真正有用的信息,既脆弱又难以维护。

而 ACP(Agent Client Protocol)提供了一个更优雅的解法。 它在 CLI 交互之上抽象出一层统一的、结构化的协议层,让上层编排系统无需关心底层 Agent 的具体实现细节,就能以一致的方式与不同的 Coding Agent 进行通信和协作。

基于这个思路,我做了一个开源项目来验证这个想法 👇

https://t.co/Sl1nMKd7Yq
👁 1,998♥ 12🔁 2💬 6
2026-02-10
Hey,来看个好玩的东西 🤣
👁 274♥ 2🔁 0💬 0
2026-02-10
这里的现状可以是某个问题、某个模块的现状。

在某些改动点可能比较多的场景下,先让 AI 提供一个「底座 / 框架」给你去修改,比起你自己自述所有改动要轻松得多。

这里还用上了 git 这个超能力。
👁 1,070♥ 0🔁 0💬 2
2026-02-10
上下文工程,我常用的一个小技巧:

让 AI 把现状先写到一个 MD 文件里

git commit

Review & 修改 MD 文件

/clear

让 AI 基于 git diff(你对现状的修改意见)去解决问题
👁 24,751♥ 25🔁 1💬 2
2026-02-09
卧槽,又有两个很牛逼的 Idea。这周的 Vibe 目标又有了🤣
👁 261♥ 1🔁 0💬 0
2026-02-08
来自 PayloadCMS CTO 的认可🌟

https://t.co/bkLlDtCYwh
👁 495♥ 6🔁 0💬 0
2026-02-07
过去:雇佣多个开发者,各自在独立设备上并行迭代
AI 时代:启动多个 Coding Agent,在单台设备上通过多个 Worktree 并行迭代
👁 211♥ 0🔁 0💬 0
2026-02-07
使用 Git Worktree 的两个场景:

1. 同一个需求,多路并发:
开多个 Worktree 同时跑多个 Agent,最后择优 Merge。
Worktree 的核心优势是能提供干净隔离的工作目录。这样 Agent 可以不只是 Plan,而是可以有执行。Plan 优秀 ≠ 执行优秀。

2. 不同需求,并行开发:
同样开多个 Worktree 并行跑 Agent,但拆需求时要意识到要让改动的交集尽量少一些。
Merge 时如果遇到冲突,不要手动硬解,再开一个独立 Agent 来处理。它能通过冲突点和 Diff 获得一个混合视角,重新审视所有改动,往往比人肉 Resolve 更周全。
nekocode @nekocode_cn
Git Worktree 绝对是驾驭 Coding Agent 最需要的功能之一:
快速 Fork 出多个隔离、干净的工作目录,让多个 / 不同的 Agent 并行探索不同方案,最后再 Merge 回主分支 —— 有冲突?也交给 Agent 处理就行。

这绝对是 Coding Agent 的并发放大器!

现在不少 GUI / IDE 已经支持 Worktree 管理,但如果你是 CLI 原教旨主义者,强烈推荐 agent-worktree,在保留 Coding Agent CLI 100% 原生能力的同时,补齐了 Worktree 管理能力。
👁 1,092♥ 6🔁 2💬 1
2026-02-06
Git Worktree 绝对是驾驭 Coding Agent 最需要的功能之一:
快速 Fork 出多个隔离、干净的工作目录,让多个 / 不同的 Agent 并行探索不同方案,最后再 Merge 回主分支 —— 有冲突?也交给 Agent 处理就行。

这绝对是 Coding Agent 的并发放大器!

现在不少 GUI / IDE 已经支持 Worktree 管理,但如果你是 CLI 原教旨主义者,强烈推荐 agent-worktree,在保留 Coding Agent CLI 100% 原生能力的同时,补齐了 Worktree 管理能力。
nekocode @nekocode_cn
介绍下 agent-worktree 的功能:SNAP 模式 ⚡

搭配 Claude Code 使用,任务完成、退出 CLI 时自动 merge 回主干。

用过 Conductor 但更喜欢 CLI 的朋友,你应该会很喜欢它。
👁 27,421♥ 168🔁 22💬 3
2026-02-05
介绍下 agent-worktree 的功能:SNAP 模式 ⚡

搭配 Claude Code 使用,任务完成、退出 CLI 时自动 merge 回主干。

用过 Conductor 但更喜欢 CLI 的朋友,你应该会很喜欢它。
👁 23,165♥ 21🔁 0💬 1
2026-02-05
X Screenshot 已上架!

- 支持一次选中多条推文
- 支持自定义 CSS,隐藏不需要的元素(如 Grok 按钮等)
- 支持时间格式化

https://t.co/VTpiQ8SrTm
👁 134♥ 0🔁 0💬 0
2026-02-05
非常强大!

如果你喜欢原汁原味的 Claude Code CLI,这可能是目前和原生 CLI 结合最好的 Worktree 管理工具。

演示视频稍后整理发出。
https://t.co/bkLlDtCYwh
👁 2,030♥ 23🔁 0💬 4
2026-02-04
中文圈子来说,小红书的活人感真的比 𝕏 强几百倍,不管是技术还是非技术的圈子。
是推荐算法,还是用户群体的问题?还是说我这个账号废了😅
👁 473♥ 2🔁 0💬 3
2026-02-03
怎么没见有人提 Vercel 的 bash-tool?思路真的很有趣。

Claude Code 已经证明:File System + Bash 实现的 Agentic Search,大多数时候比 RAG 更有效。

而 bash-tool 在内存里实现了 File System 和 Bash 供 Agent 调用——可能是目前最轻量的沙盒方案了。

https://t.co/bOZBBdiOaw
👁 390♥ 4🔁 0💬 0
2026-02-02
有个一劳永逸的办法:
1. 给 Agent 提供的所有 API Key 都使用 Placeholder
2. 代理本机所有网络,拦截对应请求替换 Placeholder 为真实密钥
如果 Agent 允许跑在 Docker 内的话,那网络代理更方便了
Lyric🌀 @lyricwai
效果如图,它自己去 https://t.co/DkYrGAJL2n 生成了 PDF,没问我要 APIKey,也没有把 APIKey 暴露到 prompt
👁 1,219♥ 1🔁 0💬 1
2026-02-01
X Screenshot 已上传 Chrome Web Store,目前等待审核中,应该是目前市面上最好用的推文截图插件,敬请期待😄
👁 294♥ 0🔁 0💬 1
2026-02-01
Vibe Coding 2026
🎯 目标:今年推出50+个产品/工具
进度:2/50 █░░░░░░░░░ 4%

2️⃣ x-screenshot: 自定义样式截取 X 推文的 Chrome 插件
1️⃣ agent-codemap: AI 友好的源码索引生成器

https://t.co/SJ8fPHej4M
👁 364♥ 5🔁 0💬 2
2026-01-30
🌏 给 AI 一张代码地图 ── agent-codemap
LSP 太重了?为了查个函数位置,启动一整套语言服务器,还得搞 MCP 桥接。
agent-codemap 简单粗暴:扫一遍项目,把类、函数、变量的位置全导出成 Markdown,扔 .codemap/ 目录里。AI 要啥自己翻,文件系统就是最好的接口。
轻量、渐进式披露、Agentic Search。
https://t.co/B3KYfUBEK0
👁 442♥ 7🔁 0💬 0
2026-01-29
agent-browser 有个点挺不方便的,没法直接复用 Chrome 默认 Profile。
但是我发现一个解法,可以配合 Playwriter 一块用,让 Playwriter 暴露 CDP 服务给 agent-browser:

PLAYWRITER_AUTO_ENABLE=1 npx playwriter serve --replace --host 127.0.0.1
agent-browser connect 19988
👁 331♥ 5🔁 0💬 0
2026-01-26
这其实说明了一个关键问题:很多 Skills 根本不需要封装成 Skills。

Skills = Prompt(+ 脚本)(+ Assets)
其中 Prompt 才是核心——它是 AI 时代的「脚本语言」。但只有当任务真正需要 LLM 的理解力和决策能力时,Prompt 才有价值。比如分析文本意图、生成创意方案。

而对于确定性任务,一个 Python 脚本往往更稳定、更快、更可控。用 AI 处理本该写代码解决的问题,反而引入了不必要的不确定性和延迟。
Michael Anti @mranti
我有一个小小的意见:我怎么觉得现在skills炫耀的功能,基本上我很快就可以用Claude Code手搓一个Python程序完成了,而且更稳定、更快、随时可调整订制。当然Skills把和AI的互动简化了,不过我觉得它增加的不确定性、控制力弱、延迟等问题,超越了它带来的好处。
👁 361♥ 4🔁 0💬 0
2026-01-25
Anthropic 这篇博文揭示了一个重要趋势:

与其为每个领域构建专用智能体,不如打造通用智能体,再为其配备专业化的「技能包」(Skills)。

这就好比 Claude Code 作为通用的 Agent OS,而 Skills 则是运行在这套系统上的应用程序。AI 时代的软件工程师需要掌握如何编写 Skills —— 这意味着学会组织 Prompt(LLM 的编程语言)、传统脚本,以及领域 Assets。

https://t.co/6gq0QdGniN
👁 410♥ 4🔁 0💬 0
2026-01-24
不久前还是人类大危机「疫情时代」
没想到紧接着这么快就到人类大突破「AI 时代」
👁 278♥ 0🔁 0💬 1
2026-01-18
貌似在 𝕏 上没看到有人提到 MiniMax 前几天开源的 OctoCodingBench(编程智能体指令遵循基准)评测。

简单讲,就是 MiniMax 定义了一套 Coding Agent 指令集,然后评测了下各大模型的全部通过率(ISR),和通过数量占比(CSR)。可以看到即使是最强的 Claude 4.5 Opus 的全部通过率依然只有 36.2%。

这其实验证了 Rule 并不是写得越多越好,Context 保持精简和准确依旧是必杀技。Dynamic Context / Context Engineering 的含金量在持续上升。
👁 845♥ 6🔁 0💬 0
2026-01-17
来个暴论:未来 99% 的代码都将是开源的。

因为软件的代码会比白菜还便宜。软件的价值将来自于其他地方(数据、资源、服务能力等
👁 565♥ 0🔁 0💬 0
2026-01-16
很有趣的思路!让我想起 Emscripten 用 IndexedDB 模拟 FileSystem 的设计 😆

不过这里有个权衡:当数据以特定结构存入 DB 后,Agent 按照约定去访问应该没问题,但第三方工具 / 应用又该如何访问?放弃通用的 FileSystem,也就意味着失去了与生态系统中无数外部工具的互操作性。

或许可以换个角度思考:能否构建一个工具,为 FileSystem 提供类似 SQL 的强大检索能力,然后开放给 Agent 使用?这样既保留了兼容性,又增强了查询能力 😁
lcomplete @xlcomplete
有趣,太有趣了。

这个思路太棒了,让 Agent 访问数据库比访问文件系统更高效。

一看到这条推文,我的脑回路立刻就被激活,思路一下子打开了。

1、很早之前就被 Agent 从数据库查数据的能力给震惊过,Agent 只要能连对应的数据库,不需要提供表名等信息就能找到你想要的东西,也能轻松搞定数据统计和分析。
2、我在实现 huntly 的知识库对话功能时想过两个方案:markdown 和 mcp,却从来没想过让 agent 直接去数据库里查。

要让「知识库对话」更顺畅一些,只需要再结合时下流行的 skills,写一个 markdown,大致让 AI 知道 huntly 数据库是干嘛用的,以及一些关键数据要怎么查询就可以了。

换个角度,整个事情变得如此简单。

用我最近常说的句式来收尾,huntly 的含金量又变高了。😋
👁 441♥ 5🔁 0💬 0
2026-01-13
补充下 Nano Banana 给的配图。

可以看出 CC 在架构设计上也并非凭空捏造,而是贯彻 Unix 哲学精髓,建立在几十年操作系统设计的智慧之上的。这也奠定了它能成为一个通用 Agent Runtime 的基础。

从最早社区有大量用户把它用于代码以外的任务,到官方就后续推出的 Agent SDK 和 Cowork,也都证明了 CC 的通用能力到底有多强。
👁 351♥ 0🔁 0💬 0
2026-01-12
发现了一些 Claude Code 隐藏的设计哲学!

最近 Claude Code 的更新,给 Skill 新增了 context:fork 的配置。相信各位对计算机科学有了解的话,应该对「Fork」这个词不陌生。如果你顺着这个词去发散的话,是不是会发现:

1️⃣ Skill 的 Context Fork 是不是有点类似「创建新进程」。而 SubAgent 运行时上下文隔离,是不是也和 OS 的进程隔离类似呢。
2️⃣ 那 Skill 岂不就是「应用」!文件夹就是资源包 (Assets),Prompt 是业务逻辑 (Logic),里面还封装了应用配置和数据。既可由用户手动运行,亦可被 Agent 自动调度。

这不妥妥的就是一个 Agent OS 么!
👁 2,486♥ 7🔁 0💬 1
2026-01-11
Bash is all you Need.

LLM 本身就很适合作为一个 Bash 工具,输出输出都是文本流,可以很方便的与其他 Bash 工具 Pipe 串联起来。

Claude Code 的理念就像是给 Agent 提供一个可操作的 Unix 系统环境,让它能拟人化的借助 File System, Bash Scripts/Tools 等这些「外部触手」自主解决复杂的问题。
宝玉 @dotey
“你们应该多用 Bash。”

过去几周,Anthropic 的 Thariq 和几十家做通用智能体的公司开了电话会议。邮件助手、客服机器人、日程管理——各种产品形态都有。聊完一圈,他发现自己反复在说同一句话。

Bash?那不是程序员用的命令行工具吗,和这些产品有什么关系?

先看一个具体场景。

假设你有一个邮件 Agent,你问它:“这周我在打车上花了多少钱?”

传统做法是这样的:Agent 调用 API 拉取邮件,可能一次性取回 100 封,然后让模型从里面找 Uber、Lyft 的收据,加总金额。

问题在于 100 封邮件塞进上下文,模型要同时记住这些内容,从中筛选、计算。这对大语言模型来说并不轻松。容易漏,容易错,而且你没法验证它到底看了哪些邮件。

这就是典型的模型舒适区问题:数据量不算大到需要专门写程序处理,但又超出了模型一次性硬算的能力范围。夹在中间,很尴尬。

Thariq 的方案是:给 Agent 一个 Bash 工具,让它把中间结果存成文件。

听起来很简单,但背后的逻辑很有意思。

传统的工具调用是这样的流程:

工具 → 模型处理 → 输出结果

所有中间状态都在模型的“脑子”里,你看不见,也没法检查。

换成 Bash 之后,流程变了:

工具 → 存文件 → 搜索/过滤 → 模型处理 → 输出结果

模型可以先把 100 封邮件存到一个文件里,然后用 grep 搜“Uber”,再 grep“Lyft”,分别统计。每一步都有迹可查,最后加总的时候,它还能回头检查自己的中间结果。

这带来三个能力升级:

可复现。同样的命令再跑一遍,结果一样。你可以调试,可以排查问题。

可验证。模型不是凭“记忆”给你答案,而是基于实际文件里的数据。你信不过的话,自己也能打开文件看一眼。

可组合。一个命令的输出可以作为下一个命令的输入,管道一接,复杂任务就能拆成简单步骤。

Bash 让 Agent 从“脑算”变成了“打草稿”。草稿可以留痕,可以检查,可以改。这对需要准确性的任务来说太重要了。

邮件搜索只是最直观的例子。Bash 的能力边界其实很宽。

链式 API 调用是个常见需求。比如“把这周我发过邮件的联系人都找出来”,这需要先拉邮件列表,提取收件人,去重,再逐个查询联系人详情。一连串操作用 Tool calls 来做,调用次数多,中间状态难管理。用 Bash 脚本串起来,逻辑清晰得多。

视频和文件处理也是 Bash 的强项。ffmpeg 这个命令行工具,模型用起来得心应手。找视频里某个片段、裁剪、转码,一行命令搞定。

还有定时任务。在 Agent 运行的容器里,用 cronjob 或 at 命令就能创建定时执行的任务。用户说“每天早上 8 点给我发一份新闻摘要”,Agent 可以自己设好闹钟。

这些场景有个共同点:都需要多步骤操作,都需要保存中间状态,都超出了单次工具调用的能力范围。

但 Bash 是把双刃剑。

能执行命令意味着能做很多事,也意味着能做很多危险的事。rm -rf 一不小心就能删光整个目录。如果 Agent 被恶意提示词攻击,后果可能很严重。

Anthropic 显然考虑到了这一点。他们在 Claude Agent SDK 里做了一套权限系统,包括 Bash 命令解析器和分级权限控制。哪些命令可以直接执行,哪些需要用户确认,哪些完全禁止,都可以配置。

我用 Claude Code 的体会是,这套权限系统确实降低了心理负担。它会在执行敏感操作前询问你,而不是闷头就干。但安全护栏不是万能药。权限系统本身也可能有漏洞,Bash 解析器也可能被绕过。

安全护栏是必需品,但不能因此就觉得万事大吉。

强调 Bash 的好处,也得说清楚它的边界。

如果任务足够简单,别用。“今天天气怎么样”这种一次性查询,直接调 API 返回结果就行,没必要存文件再处理。杀鸡用牛刀反而更慢。

如果环境是 Serverless 的,用不了。很多云函数运行时没有可持久化的文件系统,Bash 的“存中间结果”优势就没了。

如果对安全要求极高,谨慎使用。命令注入的风险无法百分之百消除,金融、医疗这类场景可能更适合用白名单式的专用工具,而非通用的 Bash。

工具的选择取决于场景,而不是工具本身的强弱。Bash 很强,但不是所有场合都该用。

回过头看,Thariq 这条建议的真正价值不是“Bash 很强”这个结论,而是背后的思维方式:

让 Agent 的思考过程“落地”到可检查的中间产物。

传统的 Agent 设计把所有东西都塞进模型的上下文,一锤子买卖。Bash 提供了另一种路径:把复杂任务拆开,每一步都留下痕迹,可以验证,可以回溯。

想想看,这和人类处理复杂问题的方式多像。我们做复杂计算时会列竖式,写长文章时会先拟提纲,处理大量信息时会做笔记。不是因为脑子记不住,而是因为落到纸上更可靠、更容易检查。

Agent 也一样。不是说模型处理不了,而是有中间产物的流程更值得信任。我自己用 Agent 辅助写作,所有中间产物都会存成文件:网络检索资料、提纲、不同版本的草稿、画图的提示词。这些存下来后续就可以灵活组合。

Bash 不只是程序员的工具,更是让 Agent 具备可验证、可复现、可审计能力的关键一环。
👁 518♥ 5🔁 0💬 0
2026-01-10
这不正说明了 Claude Code Agnet 的内部架构足够复杂,再相似的概念可能也会有不少细微的差别。也印证了「Context Engineering」到底能做到有多深 🤣

我个人是认同 Anthropic 创造的这些概念的,这些概念实际在规范、指导普通人如何更好的控制一个复杂的 Agent 系统,其实是在降低大家的门槛。
Yumin @YuminAI
Anthropic这帮人是有病吧
他们发明了plugin, agents, skills
但这不都是一堆markdown文件吗
为什么还区分那么多?

无非都是prompt
ok,有些prompt可以被重复使用
但你也不致于发明这么多概念啊

你就老老实实的说
这个是做ui的prompt
这个是做code review的prompt
这个是做web search的prompt , 但你可以同时开多个进程来跑这个prompt

我他妈还寻思这都是什么高科技呢
天天装神弄鬼,也不学点好
👁 698♥ 6🔁 0💬 0
2026-01-07
即便在 Vibe Coding 时代,主动管理 Context 依然是高级工程师的分水岭。分享几个 Claude Code 实战心得:

1️⃣ 果断新开 Conversation:无论任何时候,重开是让 AI 「重新聚焦」最快的方式,可以避免幻觉积累。
2️⃣ 手动 /compact:在维持一定上文的同时,减少一些噪音。
3️⃣ 善用 /export:将高质量 Context 持久化,实现跨 Conversation 的记忆共享。

保持 AI 聚焦,是 AI 时代程序员的新基本功。
👁 439♥ 3🔁 0💬 0
2026-01-06
截至目前为止,已收到过上百封网友来信,提出了各种问题和需求。但作为免费的业余项目有时难免力不从心啊 😅
这个项目我主要还是用来研究 Next.js & Emscripten 的(感兴趣的可以访问下试试,感受下 Next.js 极致优化下的体验),目前的成功只能说是个副产品。
👁 635♥ 5🔁 0💬 0
2026-01-05
如果你还在自己从零搭建 Agent,不妨换个思路:直接用 Claude Code 来设计和验证你的 Workflow。
Claude Code 本质上是一个通用的 Agent Runtime,远不止是代码工具。它集成了行业标准能力:

Skills - 渐进式披露的领域知识
MCP - 连接任意外部工具和系统
Subagents - 上下文独立的子任务分解能力
Hooks - 在关键节点注入自定义逻辑

用它快速完成 Workflow 设计和测试,验证可行后再用 Claude Agent SDK 封装成产品级方案。这条路径既能借力业界最强的 Agent 能力,又能保持架构的灵活性。
👁 373♥ 5🔁 0💬 0
2026-01-04
Spec-Driven Development 就跟 Java 设计模式一样,又长又臭,有点用,但用(/写)得太多是反作用。大多数人掌握不好那个度,容易陷进过度设计的陷阱。

就如我之前提到的 JIT Context。现在优秀的 Context Engineering 都是围绕着「如何构造最有价值的上下文」来设计的,要让每一个 Token 发挥最大的价值。但现在大多数人所谓的 Spec-Driven Development 明显是反模式的,把一堆文档丢给 LLM,大量的「规则」反而会影响 LLM 的注意力和遵循能力。

真正要用好 Spec-Driven Development 的话,一定是要模块化、渐进式的。把需求拆分成多个模块、计划,每一步再单独进行 Spec-Driven。
宝玉 @dotey
我个人不喜欢 Spec-Driven Development,有点像瀑布模型写系统设计文档,理论上看起来很牛,但是并不好操作,另外容易想的太多。

我比较推崇小版本迭代,不需要写详细的 spec,几句简单的 prompt 就可以开始生成,每次写一个可以跑起来的版本,然后一点点迭代,每次迭代完都是可以运行的版本

另外大多数时候,Claude Code 的 Plan Mode 就足够好用了,根据你当前想实现的,会写一个 plan 文档,可以反复沟通确认。
👁 10,316♥ 38🔁 5💬 5
2026-01-03
这几天,在我们这三线城市(深圳旁的一个小城市)又入手了套房。
业主是深圳的,这房子她刚好高峰期「投资」的,当时单价接近两万,现在同户型最新成交一万不到,刚好「腰斩」。
和她电话沟通谈价时,她说这地方现在就是她的伤心地,赶紧脱手卖了以后再也不来这地了。
👁 987♥ 2🔁 0💬 1
2026-01-02
坚持和 AI 进行「反复、深度讨论」,而不是简单的拾人牙慧。
👁 220♥ 1🔁 0💬 0
2026-01-02
最可怕的不是 AI 会思考,而是人类放弃思考。把 AI 当外脑没问题,但别让它成为唯一的大脑。
👁 324♥ 1🔁 0💬 1
2026-01-01
当初 FTX 的统一保证金体系也是独一档的。虽然倒闭让我的资金打了水漂,但比起金钱损失,更让我难受的是一个这么出色的产品就此成为历史。
Benson Sun @BensonTWN
FTX 倒了三年了。

撇開 SBF 做的那些事不談,純粹從產品角度來看,FTX 很多功能放到現在依然能打,甚至領先現在多數交易所。

子帳號系統到現在沒有任何一家做到類似體驗。FTX 的子帳號是原生帳號架構,不是那種層層疊疊、權限綁手綁腳的設計。開一個子帳號就像開一個全新帳戶,乾淨俐落。

美股代幣FTX 上輪週期就在做了。這輪才開始有交易所把這當賣點來宣傳,晚了一整個週期。

Quant Zone 更是一絕。不用寫程式就能建立自動化策略,我以前做套利都直接開 Quant Zone 跑,省下大量開發時間。

其他產品還包括指數合約、槓桿代幣,以及當時全網唯一的每小時結算、無cap 的資金費率,和 RFQ 的 OTC desk。

FTX 的產品設計確實超前了這個行業一整個週期。三年過去了,如果 SBF 沒作惡,如果 FTX 還在 ,我相信還會引領更多 CEX 的創新,真的可惜了。
👁 360♥ 0🔁 0💬 0