13 years of hands-on R&D experience — 10 years in backend (primarily Java) and 3 years in frontend (primarily React). I’ve gone from writing code to leading teams to designing architectures. Basically, I’ve stepped into most of the pitfalls there are to find.
In my most recent role, I built a team from 0 to 1 and led the architecture design and implementation of an AI+SaaS veterinary hospital system. We shipped version 1.0 in 3 months and earned validation from our angel customers. Before that, I spent 7+ years at Ruijie Networks, progressing from Frontend Lead to Java Lead to LMT (Lifecycle Management Team) Lead. I managed a 10-person team and owned core modules of a SaaS operations platform serving 500+ tenants. Received “A” performance ratings for two consecutive years and won the Business Unit Outstanding Employee award.
Technically, I won’t bore you with the standard stack — Java ecosystem, React, microservices, databases, etc. What’s more interesting is my work on AI engineering and production deployment: ASR-based medical record generation, RAG knowledge bases, and server capacity prediction (ClickHouse + Flink + Prophet + LLaMA2). Additionally, my stint as a Product Assistant taught me to move fluidly between technical and business perspectives — you’ll never get “requirements misinterpretation leading to rework” from me.
Leading teams is way harder than debugging code. But fortunately, my report card on both fronts is decent enough.
graph LR
P[1. 规划 拆任务、定目标] --> E[2. 执行 搜资料、调工具]
E --> R[3. 自我反思 挑刺、补漏]
R --> H[4. 人类审核 关键节点拍板]
H -->|需要修正| P
H -->|通过| D[交付]
style P fill:#fff3e6
style E fill:#e6ffe6
style R fill:#ffe6e6
style H fill:#e6f3ff
本文数据来源于 JoshKale/jobs 项目,该项目由 Andrej Karpathy(前 OpenAI 联合创始人、Tesla AI 总监)发起,后由 Josh Kale 维护。项目基于美国劳工统计局(BLS)的342种职业数据,使用 Gemini Flash AI 模型对每个职业进行 AI 暴露评分(0-10分),分数越高表示被 AI 替代的风险越大。
核心发现
这份研究报告涵盖了美国经济中 342 种职业,涉及 1.43 亿个工作岗位。研究发现:
全行业平均暴露分:5.3/10(高于中位数)
高危职业(8分以上):60 个
极高危职业(9-10分):31 个
这意味着,约 6000 万个岗位处于高风险区间,占所有岗位的 **42%**。
Karpathy 的核心观点:”如果你的全部工作都在屏幕上进行,那你就危险了。”
评分标准解读
在深入了解高危职业之前,让我们先理解评分标准:
评分
风险等级
典型职业
0-1
极低风险
屋顶工、清洁工、建筑工人
2-3
低风险
电工、水管工、护士助理、消防员
4-5
中等风险
注册护士、零售员、医生
6-7
高风险
教师、经理、会计师、工程师
8-9
极高风险
软件开发、律师助理、数据分析师、编辑
10
最高风险
医疗转录员
核心判断标准:工作产出是否是根本性的数字化的?如果能在家庭办公室通过电脑完成——写作、编程、分析、沟通——那么 AI 暴露就是天然高的。
高危职业排行榜(8分以上)
🚨 满分 10/10(最高风险)
1. 医疗转录员 (Medical transcriptionists)
暴露评分:10/10
AI 评估理由:医疗转录是一种纯粹数字化、常规性的信息处理任务,已经受到语音识别的严重冲击。现代 AI 语音转文字技术已经达到很高的准确率,可以自动识别医学术语并生成标准化文档。这项工作的核心——听录音并转写为文字——完全可以由 AI 完成,人类只需进行简单的校对即可。
当 AI 智能体开始执行长时自主任务(long-running autonomous tasks),Context Engineering 也不够用了。
Harness Engineering 的核心关注点:
跨会话设计 —— 任务可能持续数小时、数天,需要中断和恢复
多智能体协作 —— 不同 Agent 如何接力完成任务
上下文检索 —— 每个新会话如何快速获取相关上下文
工具设计 —— 选择什么样的工具让模型表现最佳
验证机制 —— Agent 会过早声明”完成”,需要独立验证
智能体的常见问题:
忽略团队规范
生成违反架构依赖方向的代码
在并行执行时相互冲突
通过”熵增”逐渐降低代码质量
过早声明任务完成(而实际上有 bug)
这些问题不是”模型应该看到什么”,而是:
“系统应该阻止什么、测量什么、修复什么、验证什么”
2026 年 2 月,HashiCorp 联合创始人 Mitchell Hashimoto 在博客中明确使用了 “harness engineering” 这一说法,并赋予了它清晰的工程含义:”I don’t know if there is a broad industry-accepted term for this yet, but I’ve grown to calling this ‘harness engineering.’” [^5]
如果用传统软件工程类比,Harness Engineering 有点像 JUnit、CI/CD、测试基建、脚手架、约束机制和运行环境设计的组合体——它覆盖的不只是”评测和 CI”,还包括 agent legibility、repo as system of record、AGENTS.md、自动化反馈循环、工具约束、任务接力、E2E verification、并行协作结构。