代理应用程序的 OWASP Top 10

什么是 OWASP Agentic 应用程序 10 强？

针对自主规划、使用工具并与外部服务交互的人工智能代理系统的最关键安全风险排名。随着人工智能代理系统从研究走向生产部署，2026 年版将针对新出现的威胁进行分析。

1️⃣ ASI01 - Agent Goal Hijack

Critical

概述

攻击者通过精心设计的输入操纵代理的目标或目的，使其追求非预期目标。与简单的提示注入不同，目标劫持可持续跨越多个规划步骤，导致代理自主采取一系列有害行动。

风险

攻击者可以重定向自主代理，以外泄数据、修改系统配置或执行多步骤攻击链，由于代理看似正常运行，因此很难被发现。

漏洞代码示例

        Python
        ❌ Bad
      

# Agent goal is derived directly from untrusted input
def run_agent(user_request: str) -> str:
    goal = f"Complete this task: {user_request}"
    plan = llm.plan(goal)
    for step in plan:
        execute(step)  # No validation of planned steps

安全代码示例

        Python
        ✅ Good
      

import re

ALLOWED_GOALS = ["summarize", "search", "draft_email", "analyze_data"]

def sanitize_goal(user_request: str) -> str:
    # Strip injection patterns
    cleaned = re.sub(r'(?i)(ignore|override|new goal|forget).*', '', user_request)
    return cleaned.strip()

def run_agent(user_request: str) -> str:
    sanitized = sanitize_goal(user_request)
    goal = f"Complete this task: {sanitized}"
    plan = llm.plan(goal)

    # Validate each step against allowed actions
    for step in plan:
        if step.action not in ALLOWED_GOALS:
            raise ValueError(f"Disallowed action: {step.action}")
        if goal_drift_detected(step, sanitized):
            raise ValueError("Goal drift detected, aborting")
    for step in plan:
        execute(step)

缓解措施清单

在制定目标前对所有输入进行消毒和验证
跨规划步骤实施目标偏移检测
保存允许的代理目标清单
记录所有目标更改，并对意外更改触发警报

2️⃣ ASI02 - 工具滥用和开发

Critical

概述

可访问外部工具（应用程序接口、文件系统、数据库、网络浏览器）的代理可被操纵滥用这些工具。不受限制的工具访问允许攻击者通过代理执行未经授权的操作。

风险

拥有无限制工具访问权限的代理可以删除文件、发送未经授权的 API 请求、通过网页浏览外泄数据或修改关键系统配置。

漏洞代码示例

        Python
        ❌ Bad
      

# Agent can call any tool without restrictions
def agent_execute(tool_name: str, params: dict):
    tool = tools_registry.get(tool_name)
    return tool(**params)  # No validation or approval

安全代码示例

        Python
        ✅ Good
      

TOOL_ALLOWLIST = {
    "web_search": {"max_calls": 10, "approval": False},
    "send_email": {"max_calls": 1, "approval": True},
    "file_write": {"max_calls": 5, "approval": True},
}

def agent_execute(tool_name: str, params: dict, session) -> str:
    if tool_name not in TOOL_ALLOWLIST:
        return "Error: Tool not permitted"

    config = TOOL_ALLOWLIST[tool_name]
    if session.tool_calls[tool_name] >= config["max_calls"]:
        return "Error: Tool call limit exceeded"

    if config["approval"]:
        if not request_human_approval(tool_name, params):
            return "Action denied by user"

    session.tool_calls[tool_name] += 1
    return tools_registry[tool_name](**params)

缓解措施清单

对代理可调用的工具保持严格的允许列表
高强度工具操作需要人工批准
执行每个会话和每个工具的速率限制
执行前根据预期模式验证工具参数

3️⃣ ASI03 - 身份与特权滥用

Critical

概述

代理通常会继承启动代理的用户或服务账户的身份和权限。这种过度的权限继承允许代理执行超出必要范围的操作，一旦代理被入侵，就会产生广泛的攻击面。

风险

使用管理员凭证运行的受损代理可以访问所有系统、修改权限并在整个组织内提升权限。

漏洞代码示例

        Python
        ❌ Bad
      

# Agent inherits full user credentials
def create_agent(user_session):
    agent = Agent(
        credentials=user_session.full_credentials,  # All permissions!
        scope="*",
    )
    return agent

安全代码示例

        Python
        ✅ Good
      

def create_agent(user_session, task_type: str):
    # Issue scoped, short-lived credentials for the agent
    scoped_token = auth.create_scoped_token(
        parent_token=user_session.token,
        scopes=TASK_SCOPES[task_type],  # Minimal required permissions
        ttl_minutes=30,
        max_actions=50,
    )

    agent = Agent(
        credentials=scoped_token,
        scope=TASK_SCOPES[task_type],
        audit_log=True,
    )
    return agent

TASK_SCOPES = {
    "summarize": ["read:documents"],
    "draft_email": ["read:contacts", "draft:email"],
    "analyze": ["read:data", "write:reports"],
}

缓解措施清单

针对代理任务签发范围有限的短期凭证
切勿向代理传递完整的用户或管理员凭据
实施具有最大操作限制的每项任务权限边界
审计代理执行的所有特权操作

4️⃣ ASI04 - 代理供应链漏洞

High

概述

代理系统依赖于第三方插件、工具集成和共享代理框架。代理供应链中被破坏或恶意的组件可能会引入后门、数据外泄渠道或未经授权的功能。

        Python
        ❌ Bad
      

# Loading plugins without verification
def load_plugin(plugin_url: str):
    code = requests.get(plugin_url).text
    exec(code)  # Arbitrary code execution!

        Python
        ✅ Good
      

import hashlib, importlib

TRUSTED_PLUGINS = {
    "search_plugin": "sha256:a1b2c3...",
    "email_plugin": "sha256:d4e5f6...",
}

def load_plugin(plugin_name: str) -> None:
    if plugin_name not in TRUSTED_PLUGINS:
        raise ValueError(f"Untrusted plugin: {plugin_name}")

    module = importlib.import_module(f"plugins.{plugin_name}")
    actual_hash = compute_hash(module.__file__)

    if actual_hash != TRUSTED_PLUGINS[plugin_name]:
        raise ValueError("Plugin integrity check failed")

    module.init(sandbox=True)

缓解措施清单

加载前使用加密签名验证插件的完整性
维护经批准的代理插件和工具的注册表
在权限有限的沙盒环境中运行第三方插件
为所有代理框架依赖关系实施 SBOM 跟踪

5️⃣ ASI05 - 意外代码执行

Critical

概述

可以生成和执行代码的代理（如数据分析代理、编码助手）可能会被诱骗运行恶意代码。如果没有适当的沙箱，这可能会导致系统受损、数据被盗或横向移动。

风险

在生成的代码上使用 eval() 或 exec() 的代理可被用于远程代码执行，使攻击者能够获得完全的系统访问权限。

漏洞代码示例

        Python
        ❌ Bad
      

# Agent executes generated code directly
def code_agent(task: str) -> str:
    code = llm.generate_code(task)
    result = eval(code)  # Dangerous!
    return str(result)

安全代码示例

        Python
        ✅ Good
      

import subprocess, tempfile, os

BLOCKED_MODULES = ["os", "subprocess", "socket", "shutil"]

def code_agent(task: str) -> str:
    code = llm.generate_code(task)

    # Static analysis: block dangerous imports
    for mod in BLOCKED_MODULES:
        if f"import {mod}" in code or f"from {mod}" in code:
            raise ValueError(f"Blocked import: {mod}")

    # Execute in sandboxed container with resource limits
    result = sandbox.run(
        code=code,
        timeout=30,
        memory_mb=256,
        network=False,
        read_only_fs=True,
    )
    return result.output

缓解措施清单

切勿在主机环境中对代理生成的代码使用 eval() 或 exec()
在有资源限制的沙盒容器中执行生成的代码
执行静态分析，阻止危险的导入和系统调用
在代码执行环境中禁止网络访问并强制执行只读文件系统

6️⃣ ASI06 - 内存和上下文中毒

High

概述

保持持久内存（RAG、对话历史、学习偏好）的代理很容易受到内存中毒的影响。攻击者会向代理的知识库中注入恶意内容，导致代理在未来的交互中产生受影响的输出。

        Python
        ❌ Bad
      

# Agent stores all interactions without validation
def store_memory(agent_id: str, interaction: str):
    memory_db.insert(agent_id, interaction)  # No filtering

        Python
        ✅ Good
      

def store_memory(agent_id: str, interaction: str, source: str):
    # Validate content before storing
    if contains_injection_patterns(interaction):
        log.warning(f"Blocked poisoned memory: {agent_id}")
        return

    memory_db.insert(
        agent_id=agent_id,
        content=interaction,
        source=source,
        provenance=compute_provenance(source),
        timestamp=now(),
        ttl_days=30,  # Auto-expire old memories
    )

def retrieve_memory(agent_id: str, query: str) -> list:
    results = memory_db.search(agent_id, query)
    # Filter by provenance score
    return [r for r in results if r.provenance_score > 0.8]

缓解措施清单

在将所有输入存储到代理内存之前进行验证和消毒
跟踪所有内存条目的出处，并根据信任度得分进行筛选
为内存条目设置 TTL（生存时间），限制中毒持续时间
监控存储内存中的异常模式并启用回滚功能

7️⃣ ASI07 - 不安全的代理间通信

High

概述

代理相互通信的多代理系统很容易受到信息篡改、欺骗和窃听的影响。如果没有适当的身份验证和完整性检查，受损的代理可以向代理网络注入恶意指令。

        Python
        ❌ Bad
      

# Agents communicate via plain text messages
def send_to_agent(target: str, message: str):
    channel.send(target, message)  # No auth, no signing

        Python
        ✅ Good
      

import hmac, json, time

def send_to_agent(target: str, message: str, sender_key: bytes):
    payload = {
        "content": message,
        "sender": agent_id,
        "target": target,
        "timestamp": time.time(),
        "nonce": os.urandom(16).hex(),
    }
    signature = hmac.new(
        sender_key, json.dumps(payload).encode(), "sha256"
    ).hexdigest()
    payload["signature"] = signature

    encrypted = encrypt(json.dumps(payload), target_public_key)
    channel.send(target, encrypted)

def receive_message(data: bytes, private_key) -> dict:
    payload = json.loads(decrypt(data, private_key))
    if not verify_signature(payload):
        raise ValueError("Invalid message signature")
    if is_replay(payload["nonce"]):
        raise ValueError("Replay attack detected")
    return payload

缓解措施清单

使用 HMAC 或数字签名签署所有代理间信息
端到端加密代理间通信通道
实施基于 nonce 的重放攻击防范
接受信息前验证代理身份

8️⃣ ASI08 - 级联故障

High

概述

在多代理或多步骤工作流中，一个代理的错误或恶意操作可能会在系统中传播，造成连锁故障。如果没有适当的错误界限，一个出错的步骤就会破坏整个流水线。

        Python
        ❌ Bad
      

# Errors propagate without boundaries
def pipeline(data):
    result1 = agent_a.process(data)
    result2 = agent_b.process(result1)  # If agent_a fails or is poisoned...
    result3 = agent_c.process(result2)  # ...error cascades to all
    return result3

        Python
        ✅ Good
      

from circuitbreaker import circuit

class AgentPipeline:
    def __init__(self):
        self.circuit_breakers = {}

    @circuit(failure_threshold=3, recovery_timeout=60)
    def safe_execute(self, agent, data):
        result = agent.process(data)
        if not validate_output(result):
            raise ValueError("Output validation failed")
        return result

    def pipeline(self, data):
        try:
            r1 = self.safe_execute(agent_a, data)
        except Exception:
            r1 = fallback_a(data)

        try:
            r2 = self.safe_execute(agent_b, r1)
        except Exception:
            r2 = fallback_b(r1)

        return r2

缓解措施清单

在代理流水线各阶段之间安装断路器
验证每个流水线阶段的输出，然后再传递到下一个阶段
为工作流程中的每个关键代理提供后备处理程序
设置超时和重试限制，防止代理链出现无限循环

9️⃣ASI09--人--代理信任利用

Medium

概述

用户可能会过度信任代理的输出结果，并在没有充分审查的情况下批准行动。如果代理提出的建议可信度很高，但依据不足，就会导致用户做出有害的决定。攻击者可以利用这种信任关系。

        Python
        ❌ Bad
      

# Agent requests approval without context
def request_action(action: str):
    # "Deploy to production?" - user clicks Yes without review
    return ui.confirm(f"Execute: {action}?")

        Python
        ✅ Good
      

def request_action(action: str, context: dict) -> bool:
    confidence = context.get("confidence", 0.0)
    risk_level = assess_risk(action)

    approval_request = {
        "action": action,
        "confidence": f"{confidence:.0%}",
        "risk_level": risk_level,
        "reasoning": context["reasoning"],
        "affected_systems": context["systems"],
        "reversible": context.get("reversible", False),
    }

    # Force detailed review for high-risk or low-confidence
    if risk_level == "high" or confidence < 0.8:
        return ui.detailed_review(approval_request)

    return ui.confirm(approval_request)

缓解措施清单

显示所有代理建议的置信度分数和理由
要求对高风险或低置信度行动进行详细审查
在审批对话框中显示受影响系统和可逆性状态
实施渐进式信任：开始时加强监督，随着代理证明可靠而减少监督

🔟 ASI10 - 流氓特工

High

概述

由于目标不一致、对手操纵或突发行为，代理可能会偏离预期目的。流氓代理可能会追求与组织目标相冲突的目标、积累资源或抵制关闭尝试。

        Python
        ❌ Bad
      

# Agent runs without monitoring or kill switch
def run_agent(task):
    while True:
        agent.step()  # No termination condition

        Python
        ✅ Good
      

class MonitoredAgent:
    def __init__(self, agent, max_steps=100):
        self.agent = agent
        self.max_steps = max_steps
        self.step_count = 0
        self.behavior_log = []

    def run(self):
        while self.step_count < self.max_steps:
            action = self.agent.next_action()

            # Check for rogue behavior
            if self.is_off_task(action):
                log.alert(f"Rogue behavior: {action}")
                self.shutdown()
                return

            # Check guardrails
            if not guardrails.check(action):
                log.warning(f"Guardrail violation: {action}")
                continue

            self.agent.execute(action)
            self.step_count += 1
            self.behavior_log.append(action)

    def shutdown(self):
        self.agent.stop()
        revoke_credentials(self.agent.id)
        notify_admin(self.behavior_log)

缓解措施清单

对所有代理实施行为监控和异常检测
设置最大步长限制并执行自动终止
部署防护栏，在执行前根据策略检查每个操作
维护一个可撤销证书和停止代理执行的 "必杀开关"。

📊 汇总表

身份证	脆弱性	严重性	关键缓解措施
ASI01	特工目标劫持	Critical	输入净化、目标漂移检测、目标允许列表
ASI02	工具滥用与开发	Critical	工具允许列表、人工审批、费率限制
ASI03	身份与特权滥用	Critical	范围凭证、短期令牌、最小特权
ASI04	代理供应链漏洞	High	插件签名验证、沙箱执行
ASI05	意外代码执行	Critical	沙箱容器、静态分析、无 eval()
ASI06	记忆与语境中毒	High	输入验证、出处跟踪、内存 TTL
ASI07	不安全的代理间通信	High	信息签名、加密、防止重放
ASI08	级联故障	High	断路器、输出验证、后备处理程序
ASI09	人与代理之间的信任利用	Medium	信心展示、详细审查、逐步信任
ASI10	流氓特工	High	行为监控、防护栏、断电开关

OWASP 十佳代理应用程序（2026 年）

1️⃣ ASI01 - Agent Goal Hijack

概述

漏洞代码示例

安全代码示例

缓解措施清单

2️⃣ ASI02 - 工具滥用和开发

概述

漏洞代码示例

安全代码示例

缓解措施清单

3️⃣ ASI03 - 身份与特权滥用

概述

漏洞代码示例

安全代码示例

缓解措施清单

4️⃣ ASI04 - 代理供应链漏洞

概述

缓解措施清单

5️⃣ ASI05 - 意外代码执行

概述

漏洞代码示例

安全代码示例

缓解措施清单

6️⃣ ASI06 - 内存和上下文中毒

概述

缓解措施清单

7️⃣ ASI07 - 不安全的代理间通信

概述

缓解措施清单

8️⃣ ASI08 - 级联故障

概述

缓解措施清单

9️⃣ASI09--人--代理信任利用

概述

缓解措施清单

🔟 ASI10 - 流氓特工

概述

缓解措施清单

📊 汇总表