Khi Hermes Agent mở cửa công khai ngày 12 tháng 3, bản phát hành đi kèm hơn bảy mươi skill tích hợp phân bố trên hơn mười lăm danh mục. Bốn tuần sau, marketplace skill cộng đồng đã hoạt động tại agentskills.io với hàng trăm skill nữa. Bài này kể chuyện đó xảy ra thế nào — và vì sao kiến trúc skill của Hermes đáng hiểu dù bạn chưa bao giờ viết skill.
Skill thật sự là gì
Trong hầu hết framework AI agent, "tool" là hàm Python developer đăng ký với agent lúc import. Bạn decorate hàm, viết docstring, liệt kê trong mảng tools đâu đó. Khi agent cần, framework đưa mô tả vào prompt và parse output gọi tool từ model.
Skill trong Hermes không phải thế. Nó là bundle khai báo với manifest (skill.yaml), tập script hoặc entrypoint Python, mô tả tiên quyết, và chính sách kích hoạt. Khi Hermes khởi động, nó duyệt thư mục skill, đọc từng manifest, và quyết định skill nào khả dụng cho session này dựa trên tiên quyết có thật sự tồn tại trên máy không — biến môi trường, binary trên PATH, mục config, khả năng nền tảng.
Skill cần ffmpeg sẽ không quảng cáo cho agent trên máy không cài ffmpeg. Skill cần bot token Telegram chỉ kích hoạt khi session nối Telegram. Prompt agent chỉ mang skill bạn thật sự dùng được lúc này.
Nghe nhỏ nhưng đây là lý do agent ship bảy mươi skill ngày đầu mà prompt không nổ.
Skills Hub và nó làm gì
Đi kèm Hermes từ v0.2.0 là thứ gọi là Skills Hub — chỉ mục local của mọi skill khả dụng cho bản cài này, với metadata, ghi nguồn và lớp kích hoạt có điều kiện. Bạn chạy hermes skills list xem gì đã cài, hermes skills enable <tên> hoặc hermes skills disable <tên> bật tắt, và hermes skills info <tên> xem manifest, nguồn và tiên quyết chính xác.
Hub cũng là abstraction mà skill cộng đồng cắm vào. Tác giả skill đăng manifest + gói source; người dùng Hermes cài bằng một lệnh; Hub xử lý kiểm tra tiên quyết và quy tắc kích hoạt y hệt skill tích hợp. Không có đường riêng cho skill "chính thức" hay "cộng đồng" — tất cả chỉ là skill.
Bốn tuần sau ra mắt, Hub lớn thành gương mặt công khai: agentskills.io. Đây là thư mục web skill cộng đồng với tìm kiếm, danh mục, số liệu phổ biến và lệnh cài chuẩn hóa. Hãy coi như npm hay pip cho khả năng agent, nhưng hẹp hơn: mỗi skill làm một việc, và đi kèm manifest bảo Hermes cách dùng an toàn.
Vì sao hệ sinh thái lớn nhanh
Bốn tuần không dài để đi từ không đến hàng trăm skill cộng đồng. Vài thứ trong kiến trúc cho phép điều đó.
Manifest là giao diện. Tác giả skill chỉ cần viết đúng manifest. Tiên quyết, mô tả, schema input, điều kiện kích hoạt — đều nằm trong skill.yaml. Triển khai có thể Python, shell script, binary — gì manifest trỏ đến cũng được. Người đóng góp không cần học SDK riêng Hermes. Họ mô tả tool trong file YAML đã tồn tại cho skill tích hợp.
Tiên quyết có cấu trúc, không chỉ ghi chú. Nếu skill cần ffmpeg, manifest nói thế, và Hermes kiểm tra. Bạn không cài skill hỏng rồi lỗi âm thầm lúc chạy vì thiếu dependency — Hub báo thiếu gì và từ chối kích hoạt. Tác giả skill được giả định, người dùng skill được tin tưởng.
Kích hoạt có điều kiện. Skill có thể khai báo chỉ kích hoạt trên Telegram, chỉ khi biến env cụ thể được đặt, chỉ khi file cụ thể tồn tại, chỉ trong thư mục làm việc nhất định. Prompt agent được may đo cho khoảnh khắc. Bạn cài trăm skill mà agent sẽ không thấy chín mươi trong bất kỳ session nào, prompt không phình.
Thân thiện sandbox mặc định. Skill thực thi code chạy bên trong lớp sandbox có sẵn của Hermes — cô lập git worktree và hệ thống checkpoint filesystem từ v0.2.0. Skill cộng đồng hư hỏng không phá được code hay file, vì sandbox nằm trong agent, không trong skill. Điều này giảm mạnh chi phí tin tưởng khi cài thứ mới.
Skill cộng đồng thường trông ra sao
Skill cộng đồng bốn tuần đầu rơi vào vài mẫu hữu ích:
- •Bọc tool CLI có sẵn. Ai đó lấy
ffmpeg,pandoc, hayimagemagick, viết skill mỏng lộ các thao tác phổ biến — cắt video, chuyển đổi tài liệu, đổi kích thước ảnh. Viết nhanh, dùng ngay. - •Tích hợp dịch vụ cá nhân. Skill nói chuyện với Notion, vault Obsidian, Home Assistant, đọc RSS, Pocket, hay app tài chính cá nhân. Hầu hết dưới 200 dòng Python cộng manifest.
- •Trợ thủ chuyên biệt. Skill cho workflow cụ thể — skill đọc paper cho nhà nghiên cứu, skill tóm tắt git log cho lead kỹ thuật, skill lên thực đơn cho đầu bếp tại nhà, trợ lý dungeon master cho nhóm chơi RPG.
- •Shim theo model. Skill thêm tính năng riêng provider (header cache prompt, budget suy luận, hook fine-tuning) như tool agent chính thức thay vì yêu cầu code client tùy chỉnh.
Không cái nào đơn lẻ là killer feature. Gộp lại, chúng là lý do Hermes thôi giống "thứ Nous Research xây" và bắt đầu giống cộng đồng.
Hệ quả thú vị
Ngày agentskills.io vượt trăm skill cộng đồng, có gì đó nhẹ nhàng thay đổi về dự án. Không còn mô tả được Hermes Agent là gì bằng cách liệt kê tính năng, vì tập tính năng đã vô hạn. Thứ bạn mô tả được là hình dáng của nó: một agent duy nhất, nói chuyện với bất kỳ nền tảng chat nào bạn thích, kéo skill theo yêu cầu, dưới mô hình an toàn thống nhất.
Đó không phải danh sách tính năng. Đó là nền tảng. Và đó là lý do hệ sinh thái skill quan trọng hơn bất kỳ khả năng riêng lẻ nào bên trong nó.