Day 06 · 🔐 Linux 权限与提权

Linux/Unix 系统里每个文件、每个目录都有一组权限位，决定谁能读、写、执行。这套模型 1970 年代发明，半个世纪了仍是所有现代 Unix 系统（Linux、macOS、BSD）的基石。今天就从它讲起。

1.1 权限的三个动作 × 三种身份

把这两个维度组合起来，就有 3 × 3 = 9 位权限，外加几个特殊位（下一节讲）。

1.2 ls -l 输出全解

/usr/bin/sudo 的 -rwsr-xr-x 有个奇怪的 s——那个就是 SUID 位，下一节细讲。

1.3 chmod：数字记号

除了 chmod u+x file 这种文字记号，更常用的是数字记号。原理：rwx 三位用二进制表示 = 一个 0-7 的八进制数字。

1.4 umask：新建文件的默认权限

权限	二进制	八进制
---	000	0
--x	001	1
-w-	010	2
-wx	011	3
r--	100	4
r-x	101	5
rw-	110	6
rwx	111	7

数字	含义	典型场景
`755`	rwxr-xr-x	可执行文件、目录的默认权限
`644`	rw-r--r--	普通文档（owner 可写，别人只读）
`600`	rw-------	私密文件（SSH 私钥、配置）
`700`	rwx------	私人目录（如 ~/.ssh/）
`777`	rwxrwxrwx	⚠ 几乎永远不该用，任何人都能改

你新建一个文件，权限是怎么定的？答案是：666 - umask 值（目录是 777 - umask）。umask 是"应该移除哪些位"的掩码。

常见安全问题：开发者 umask 设成 000 或 002 后忘了改回来，结果 SSH 私钥（应该 600）创建出来变成 666，被其他用户读走。OpenSSH 会拒绝读这种"权限过宽"的私钥，但其他自定义脚本可能不会。

2. 特殊位：SUID / SGID / Sticky

9 位 rwx 之外还有三个特殊位，它们是 Linux 提权问题的头号根源。今天的重点。

2.1 SUID（Set User ID）

定义：一个二进制文件被设置了 SUID 位后，无论谁运行它，都会以"文件所有者"的身份执行。

看一个例子。passwd 命令让用户改自己的密码——但改密码意味着写 /etc/shadow，而 /etc/shadow 只有 root 能写。普通用户怎么改自己密码？答案：

那个 s = 4xxx 的特殊位 = SUID。owner 是 root，加了 SUID = "谁运行 passwd，都临时变成 root"。所以普通用户调 passwd 时，进程的 EUID（effective user ID）瞬间是 0（root），能写 shadow 文件；改完密码进程退出，权限收回。

SUID 是 Unix 早期一个极为重要的设计——它让需要特权的操作（改密码、ping 网络、挂载文件系统）不需要让用户登录到 root，也能用专用工具完成。但它也是安全黑洞——一旦某个 SUID 程序有 bug，攻击者就能用这个 bug 提权到 owner（通常是 root）。

2.2 怎么看一个程序是不是 SUID

每一个 SUID 二进制都是潜在的攻击面。攻击者拿到普通用户后，第一件事就是跑上面那条 find 命令，看有什么 SUID 程序。然后：

2.3 SGID（Set Group ID）

跟 SUID 类似，但作用于组。看到 -rwxr-sr-x 那个 group 位的 s（在 group 三位里），就是 SGID。运行该程序的进程会以"文件所属组"的身份执行。

另一种 SGID 用法：对目录设置 SGID 后，在该目录里新建的文件会自动继承目录的 group。这是多人协作（如开源项目）共享文件的常用配置。

2.4 Sticky Bit（粘滞位）

三个特殊位里相对无害的一个。给一个目录加 sticky 位后：只有文件的 owner 才能删除该目录里的文件。即使目录本身是 777，别人也只能新建自己的文件，不能 rm 你的文件。

所以 /tmp 看起来权限是 777（任何人都能写）——但因为 sticky bit，你只能删自己创建的临时文件，删不了别人的。这就是为啥 /tmp 是大家共享但又相对安全的。

2.5 数字记号扩展到 4 位

3. sudo 工作原理与 /etc/sudoers

SUID 的 su（switch user）能让你"登录"成另一个用户，但要 root 密码。sudo 则是更精细的工具：让管理员预先定义"谁可以以什么身份运行什么命令"，被授权的用户用自己的密码就能执行。

3.1 sudo 本身是 SUID 程序

所以任何用户运行 sudo，进程瞬间变成 root，由 sudo 自己内部检查 /etc/sudoers 决定该不该让你做这件事。这个流程是安全审计的核心——sudo 的 bug 往往直接提权到 root（历史上有过几次重大 CVE）。

3.2 /etc/sudoers 语法

3.3 sudoers 配置错误 = 经典提权点

案例：危险的 NOPASSWD 通配符

# 错误配置（真实出现过）：
bob ALL=(ALL) NOPASSWD: /usr/bin/find /var/log *

管理员意图：让 bob 能用 find 查日志。致命漏洞：find 有 -exec 参数能跑任意命令，所以：

sudo find /var/log -exec /bin/sh \; -quit
# 直接弹个 root shell —— 因为 sudo 以 root 身份运行 find，
# find 又以 root 身份调起 /bin/sh

这个攻击套路就是下面要讲的 GTFOBins 站点的核心内容——它把"看起来无害但能被滥用的命令"全部收录了。

3.4 sudo 的常见提权探测

攻击者拿到任何 user shell，第一件事就跑 sudo -l。每一个 NOPASSWD 条目都要审查能不能滥用。

4. Linux Capabilities：细粒度权限拆分

SUID + root 模型有个根本问题：太粗了。你只是想让 ping 能发原始网络包，结果 ping 程序拥有了 root 的所有能力（修改 /etc、kill 任何进程、加载内核模块……）。一个 ping 的 bug 就让攻击者拿到 root。

从 Linux 2.2 开始，内核引入了 Capabilities 机制，把 root 的特权拆成 ~40 个细粒度能力。每个进程可以只拥有它需要的那几个，没必要拥有全部 root 权限。

4.1 常见 capability 列表（精选）

4.2 看一个文件/进程的 capability

4.3 危险的 capability 配置

Capability	能干什么
`CAP_NET_RAW`	发送原始网络包（ping、tcpdump 需要）
`CAP_NET_BIND_SERVICE`	绑定 1024 以下端口（HTTP 监听 80 需要）
`CAP_SYS_PTRACE`	用 ptrace 跟踪/调试别的进程（gdb、strace 需要）
`CAP_SYS_ADMIN`	挂载文件系统、改主机名等（"半个 root"）
`CAP_DAC_READ_SEARCH`	绕过文件读权限检查
`CAP_DAC_OVERRIDE`	绕过所有文件权限检查（≈ root）
`CAP_CHOWN`	改文件 owner
`CAP_KILL`	给任何进程发信号
`CAP_NET_ADMIN`	配置网络接口、防火墙
`CAP_SYS_MODULE`	加载/卸载内核模块（= 完全 root）

容器场景里这点特别关键——后面 Week 9 讲 Docker 时会看到，docker run --cap-add 给容器添加能力。添加错了等于打开了逃逸通道。比如 --cap-add SYS_ADMIN 几乎等于 --privileged。

5. PAM 认证框架（轻量了解）

PAM（Pluggable Authentication Modules）是 Linux 把"认证"从程序里抽离出来的统一框架。SSH、sudo、login、su 这些工具都不自己写认证逻辑——它们调 PAM，PAM 再去读配置文件、调具体的认证模块。

对 Agent 安全的关联：如果你的 Agent 服务跑在 Linux 主机上，要让它走 SSH 远程登录，PAM 是认证链路里的关键一环。你能配置 PAM 在登录时调用你自己的检测脚本，对接异常登录检测系统。Week 4 周日讲安全综合时再回来。

6. 提权路径六大经典套路

把今天讲的拼起来，列出攻击者拿到普通 user shell 后最常用的提权路径。你的 Agent 沙箱设计要做的，就是把这些路径全部堵上。

6.1 路径 A：滥用 SUID 程序的 -exec / -e / :! 功能

这些命令只要被加了 SUID 或被 sudoers 允许 NOPASSWD，攻击者就能用它的"-exec" 类参数跑出 root shell。

6.2 路径 B：sudo -l 列出的 NOPASSWD 命令

已经讲过——任何 NOPASSWD 条目都要审查。Day 4 LAB 5 你已经动手过 sudo -l。

6.3 路径 C：可写的 PATH

案例

# 管理员给某个目录设了一个 SUID 程序，程序里调了系统命令但用相对路径：
$ cat /usr/local/bin/backup.c
int main() {
    system("tar czf /backup.tgz /data");  // ⚠ 相对路径调 tar
    return 0;
}

# 这个 SUID 程序运行时会沿 $PATH 找 tar
# 如果攻击者控制了 $PATH 顺序：
echo '#!/bin/sh
chmod u+s /bin/bash' > /tmp/tar
chmod +x /tmp/tar
PATH=/tmp:$PATH /usr/local/bin/backup
# 现在 /bin/bash 是 SUID 了，bash -p 即得到 root shell

修复方法：SUID 程序里调系统命令时必须用绝对路径（如 /bin/tar），并且代码里要重置 PATH 和 LD_PRELOAD 等环境变量。

6.4 路径 D：可写的 cron job 配置

如果某个 cron job 由 root 运行，但脚本本身/它依赖的文件/它所在的目录是用户可写的——你改了脚本，下次 cron 触发就以 root 身份跑你的代码。

6.5 路径 E：内核漏洞

这些都不需要任何特殊权限，只要内核版本中招就能利用。所以"打补丁"是基础设施安全的核心动作之一。

6.6 路径 F：可滥用的 capability

7. GTFOBins：可滥用 binary 速查站

GTFOBins.github.io 是个开源项目，专门收录"看起来无害但能被滥用提权 / 突破限制"的命令清单。每个命令列出它的 5-6 种被滥用方式：

这个网站对蓝队和红队都是必备工具。蓝队用它做"我们系统有这些 SUID 命令吗？分别要怎么防？"红队用它做"我能用现成的工具提权吗？"

8. 动手 LAB：3 条提权路径实操

LAB 推荐环境：用 Docker 起一个隔离的 Ubuntu

LAB A：用 SUID find 提权

LAB B：sudo NOPASSWD vim 提权

LAB C：CAP_SETUID 提权

三条路径的共同模式：攻击者拿到普通 shell → 用 find/getcap/sudo -l 等命令侦察 → 找到一个"配置不当的特权点" → 用它跑出 root shell。理解这个模式，你做 Agent 沙箱设计时就知道要堵哪些口子了。

🔗 与 AI / Agent 安全的连结

1. Agent code interpreter 的最低安全要求。如果你的 Agent 允许 LLM 生成代码并执行（OpenAI / Anthropic 的 code interpreter、自建沙箱）：最起码不能用 root 跑。今天讲的所有提权路径都是"普通用户 → root"的，如果起点就是 root，攻击者没必要提权，直接做坏事。规则：沙箱进程必须以 unprivileged 用户启动，uid > 1000，附加 NoNewPrivs seccomp 设置（防止 SUID 提权）。

2. 容器镜像的 SUID 审计。你打包 Agent 服务的 Docker 镜像，最佳实践是用 distroless 或 alpine 最小镜像，然后扫描所有 SUID 二进制：find / -perm -u+s，把不必要的全部清掉。一个生产镜像里如果有 find 或 vim 这种 SUID 程序，攻击者拿到沙箱后能直接提权。Week 10 讲 Docker 镜像时会展开。

3. capability 模型用对了能大幅缩攻击面。比如你的 Agent 服务需要 ping 网络（健康检查），用传统做法要 root；用 capabilities 你只给它 CAP_NET_RAW，就算被攻破，攻击者也拿不到完整 root，能干的坏事少得多。K8s 里给 Pod 配置 securityContext.capabilities.drop: ALL 然后 add 仅需的几个，是生产防御标配。

4. 监控 setuid/setgid 系统调用。攻击者在你机器上做提权时，一定会调 setuid(0) 或 setgid(0) 这两个 syscall。用 eBPF（Week 2 周六会讲）实时监控这两个 syscall，配合"调用者不是 root 而是普通用户、目标是 root"的过滤条件，可以做到秒级提权检测。Falco / Tetragon 这类工具的核心规则就是这个。

5. 别让 LLM 看到 sudoers / setcap 这些配置。如果你的 RAG 系统索引了运维文档，务必把 /etc/sudoers、setcap 列表、SSH 密钥位置这些放黑名单。否则一个 indirect prompt injection 能让 Agent 把你的提权清单完整吐出来。这其实是 Week 19（向量数据库安全）和 Week 23（LLM 攻击面）的预告。

📝 今日小练习

215 分钟 · 你 mac 上看 SUID 程序清单

# mac 上跑
find /usr /bin /sbin -perm -u+s -user root 2>/dev/null
find /Applications -perm -u+s 2>/dev/null

问题：清单里有什么？挑 3 个你不认识的，去 GTFOBins 查一下。思考：如果攻击者拿到你 mac 上的普通用户 shell（比如某个浏览器漏洞），他能用这些 SUID 程序做什么？

310 分钟 · 思考题

你设计一个 Agent 沙箱，让 LLM 生成的 Python 代码能跑。下面 4 个隔离层级，从弱到强排序，并指出每一层"如果攻击者突破，能影响什么"：

Python exec() 在主进程里跑
Python 子进程跑，但还是同一个 UNIX 用户
子进程 + 独立的非特权 UNIX 用户（uid=1001）+ NoNewPrivs
独立 Docker 容器 + non-root + cap_drop ALL + 只读 rootfs

结合今天的内容思考：A 突破后能干什么？B 比 A 多了什么保护？C 阻断了今天讲的哪些提权路径？D 进一步加了哪些防线？

Day 06 · Linux 权限与提权基础

1. Unix 权限模型：rwx + ugo + umask