使用gdb调试内核和模块

来自Lustre文件系统
跳转至: 导航搜索

内核调试器kgdb,类似于QEMU这样的管理程序或基于JTAG的硬件接口,允许在运行时使用gdb调试Linux内核及其模块。Gdb自带一个强大的python脚本接口。内核提供了一系列帮助脚本,可以简化典型的内核调试步骤。本文介绍了如何启用及使用这些脚本,主要针对QEMU/KVM虚拟机,但其中的例子也适用于其他GDBstub。

要求

gdb 7.2+ (推荐:7.4+),启用python支持 (通常发行版都启用了)

设置

  • 为QEMU/KVM创建一个虚拟Linux机器(更多详情参见www.linux-kvm.org 和www.qemu.org)。对于交叉开发的情况,https://landley.net/aboriginal/bin 中保存了一个机器映像和工具链的池,我们可以从这里开始。
  • 启用CONFIG_GDB_SCRIPTS来编译内核,但禁用CONFIG_DEBUG_INFO_REDUCED。如果你的架构支持 CONFIG_FRAME_POINTER,请使它保持启用状态。
  • 在客户机上安装该内核,如果需要还可以在内核命令行中添加"nokaslr"来关闭KASLR。另外,QEMU允许使用-kernel, -append, -initrd命令行直接启动内核,不过通常只适用于不依赖模块的情况下。关于这种模式的更多详情请参见QEMU文档。如果架构支持KASLR,你应该在禁用CONFIG_RANDOMIZE_BASE的情况下构建内核。
  • 启用QEMU/KVM的gdb stub,可以使用以下两种方法:

    • 通过在虚拟机启动时,向QEMU命令行中添加"-s"
    • 运行时从QEMU监控控制台中发出"gdbserver"

  • cd /path/to/linux-build
  • 启动gdb:gdb vmlinux

    注意:有些版本可能会限制自动加载gdb脚本到已知的安全目录。如果gdb报告说拒绝加载vmlinux-gdb.py,请添加:

    add-auto-load-safe-path /path/to/linux-build
    

    到 ~/.gdbinit。更多细节请参见gdb帮助。

  • 连接到已启动的客户机:
    (gdb) target remote :1234
    

使用Linux提供的gdb助手的例子

  • 加载模块(和主内核)符号
    loading vmlinux
    scanning for modules in /home/user/linux/build
    loading @0xffffffffa0020000: /home/user/linux/build/net/netfilter/xt_tcpudp.ko
    loading @0xffffffffa0016000: /home/user/linux/build/net/netfilter/xt_pkttype.ko
    loading @0xffffffffa0002000: /home/user/linux/build/net/netfilter/xt_limit.ko
    loading @0xffffffffa00ca000: /home/user/linux/build/net/packet/af_packet.ko
    loading @0xffffffffa003c000: /home/user/linux/build/fs/fuse/fuse.ko
    ...
    loading @0xffffffffa0000000: /home/user/linux/build/drivers/ata/ata_generic.ko
    
  • 对一些尚未加载的模块函数设置断点,例如:
    (gdb) b btrfs_init_sysfs
    Function "btrfs_init_sysfs" not defined.
    Make breakpoint pending on future shared library load? (y or [n]) y
    Breakpoint 1 (btrfs_init_sysfs) pending.
    
  • 继续
    (gdb) c
    
  • 在目标上加载模块,并观察符号是否被加载以及断点处是否暂停:
    loading @0xffffffffa0034000: /home/user/linux/build/lib/libcrc32c.ko
    loading @0xffffffffa0050000: /home/user/linux/build/lib/lzo/lzo_compress.ko
    loading @0xffffffffa006e000: /home/user/linux/build/lib/zlib_deflate/zlib_deflate.ko
    loading @0xffffffffa01b1000: /home/user/linux/build/fs/btrfs/btrfs.ko
    
    Breakpoint 1, btrfs_init_sysfs () at /home/user/linux/fs/btrfs/sysfs.c:36
    36              btrfs_kset = kset_create_and_add("btrfs", NULL, fs_kobj);
    
  • 转储目标内核的日志缓冲区:
    (gdb) lx-dmesg
    [     0.000000] Initializing cgroup subsys cpuset
    [     0.000000] Initializing cgroup subsys cpu
    [     0.000000] Linux version 3.8.0-rc4-dbg+ (...
    [     0.000000] Command line: root=/dev/sda2 resume=/dev/sda1 vga=0x314
    [     0.000000] e820: BIOS-provided physical RAM map:
    [     0.000000] BIOS-e820: [mem 0x0000000000000000-0x000000000009fbff] usable
    [     0.000000] BIOS-e820: [mem 0x000000000009fc00-0x000000000009ffff] reserved
    ....
    
  • 检查当前任务结构的字段
    gdb) p $lx_current().pid
    $1 = 4998
    (gdb) p $lx_current().comm
    $2 = "modprobe\000\000\000\000\000\000\000"
    
  • 对当前或指定的CPU使用per-cpu功能
    (gdb) p $lx_per_cpu("runqueues").nr_running
    $3 = 1
    (gdb) p $lx_per_cpu("runqueues", 2).nr_running
    $4 = 0
    
  • 使用container_of助手挖掘hrtimers
    (gdb) set $next = $lx_per_cpu("hrtimer_bases").clock_base[0].active.next
    (gdb) p *$container_of($next, "struct hrtimer", "node")
    $5 = {
      node = {
        node = {
          __rb_parent_color = 18446612133355256072,
          rb_right = 0x0 <irq_stack_union>,
          rb_left = 0x0 <irq_stack_union>
        },
        expires = {
          tv64 = 1835268000000
        }
      },
      _softexpires = {
        tv64 = 1835268000000
      },
      function = 0xffffffff81078232 <tick_sched_timer>,
      base = 0xffff88003fd0d6f0,
      state = 1,
      start_pid = 0,
      start_site = 0xffffffff81055c1f <hrtimer_start_range_ns+20>,
      start_comm = "swapper/2\000\000\000\000\000\000"
    }
    

命令和功能列表

命令和功能的数量会随着时间的推移而变化,这只是初始版本列表的快照:

(gdb) apropos lx
function lx_current -- Return current task
function lx_module -- Find module by name and return the module variable
function lx_per_cpu -- Return per-cpu variable
function lx_task_by_pid -- Find Linux task by PID and return the task_struct variable
function lx_thread_info -- Calculate Linux thread_info from task variable
lx-dmesg -- Print Linux kernel log buffer
lx-lsmod -- List currently loaded modules
lx-symbols -- (Re-)load symbols of Linux kernel and currently loaded modules

详细的帮助可以通过命令"help <command-name>"或者功能"help function <function-name>"获得。