如何用Rustt捕获和解析网络包?-堆代码网

如何用Rustt捕获和解析网络包?

发布于 2个月前
 1048 热度

 0 评论

轻描淡写
0 粉丝 31 篇博客

前两篇文章介绍了 C++和 Go 中利用 TCP Option 中的时间戳实现计算网络时延。基于“用 Rust 重写一切”的哲学，今天我们来看看 Rust 中如何做这个事情。夜深人静，再肝一篇关于网络编程的文章。Rust 中还没有和 gopacket 一样功能强大的包，它的pcap[1]用来捕获网络包没有问题，但是缺乏解析的能力，所以我们使用另外一个包pdu[2]来实现网络包的解析。

备注：当然 rust 生态圈中还有其他的包捕获库如pnet[3]、包解析库如etherparse[4]等，但是我选择了 pcap 和 pdu，因为针对这篇文章的场景，它们用起来很顺手。

为了简单起见，我们不像前两篇文章那样的程序那么复杂，还要解析参数，针对参数做不同的处理，这次 Rust 实现的程序中，我们主要实现其最核心的功能：
1.捕获 TCP 包
2.解析 TCP 选项中的时间戳

3.计算时延

我是在 Mac mini 的进行开发和运行的，理论在 Linux 上也是可以运行的。你可能需要安装libpcap库。Mac 上可能你需要临时设置权限，才有可能正常运行程序：

sudo chmod 666 /dev/bpf*

首先看看程序运行的效果：

那么程序一开始，我们开始要使用 pcap 捕获包：

use std::net::{Ipv4Addr,Ipv6Addr};
use std::ops::Sub;
use std::time::{Duration, UNIX_EPOCH};
use chrono::{DateTime, Local};

use macaddr::MacAddr;
use pcap;
use pdu::*;
use libc;

fn main() {
    // 这个用来记录flow已经它被捕获的时间
    let mut map = std::collections::HashMap::new();

    // 在Mac上，使用en1网卡
    let mut cap = pcap::Capture::from_device("en1")
        .unwrap()
        .immediate_mode(true)
        .open()
        .unwrap();

    // 你可以设置filter，这里我们简化不进行设置了
    // cap.filter("host 127.0.0.1", true).unwrap();

    while let Ok(packet) = cap.next_packet() {
        // 得到捕获的包信息

        ......
    }
}

目前我们只能得到捕获的包信息，包括 pcap 增加的头信息(捕获时间、包长度等)和包的数据。我们需要解析包的数据，得到 TCP 包，然后解析 TCP 选项中的时间戳。目前 pcap 不能帮助我们了。我们在那个 while 循环中一步一步补充省略的代码：

        let ethernet = EthernetPdu::new(&packet.data).unwrap();
        // 堆代码 duidaima.com
        // 实现代码，输出源和目的MAC地址,转换成MacAddr类型
        let _src_mac = MacAddr::from(ethernet.source_address());
        let _dst_mac = MacAddr::from(ethernet.destination_address());

        // println!("ethernet: src_mac={}, dst_mac={}", src_mac, dst_mac);

        let ei = ethernet.inner();
        let (src_ip,dst_ip, tcp) = match ei {
            Ok(Ethernet::Ipv4(ref ip)) => {
                let src_ip = Ipv4Addr::from(ip.source_address()).to_string();
                let dst_ip = Ipv4Addr::from(ip.destination_address()).to_string();

                let tcp = match ip.inner() {
                    Ok(Ipv4::Tcp(tcp)) => Some(tcp),
                    _ => None
                };

                (src_ip,dst_ip,tcp)
            }
            Ok(Ethernet::Ipv6(ref ip)) => {
                let src_ip = Ipv6Addr::from(ip.source_address()).to_string();
                let dst_ip = Ipv6Addr::from(ip.destination_address()).to_string();

                let tcp = match ip.inner() {
                    Ok(Ipv6::Tcp(tcp)) => Some(tcp),
                    _ => None
                };

                (src_ip,dst_ip,tcp)
            }
            _ => (String::new(),String::new(),None)

        };

        ......

首先解析出ethernet层,和 gopacket 调用方法不同，但是一样很简洁。ethernet中包含源目的 Mac 地址，如果你需要，你可以调用相应的方法获取它们。本程序不需要这两个信息，忽略即可。

接下来解析IP层,这会涉及到 ipv4 和 ipv6 两种情况，我们分别处理。

        let ei = ethernet.inner();
        let (src_ip,dst_ip, tcp) = match ei {
            Ok(Ethernet::Ipv4(ref ip)) => {
                let src_ip = Ipv4Addr::from(ip.source_address()).to_string();
                let dst_ip = Ipv4Addr::from(ip.destination_address()).to_string();

                let tcp = match ip.inner() {
                    Ok(Ipv4::Tcp(tcp)) => Some(tcp),
                    _ => None
                };

                (src_ip,dst_ip,tcp)
            }
            Ok(Ethernet::Ipv6(ref ip)) => {
                let src_ip = Ipv6Addr::from(ip.source_address()).to_string();
                let dst_ip = Ipv6Addr::from(ip.destination_address()).to_string();

                let tcp = match ip.inner() {
                    Ok(Ipv6::Tcp(tcp)) => Some(tcp),
                    _ => None
                };

                (src_ip,dst_ip,tcp)
            }
            _ => (String::new(),String::new(),None)

        };

        if tcp.is_none() {
            continue;
        }
        let tcp = tcp.unwrap();

调用inner方法就可以得到IP层的信息，我们处理 ipv4 和 ipv6 两种情况，分别获取源目的 IP 地址和 TCP 层这三个数据。因为一开始我们没有设置 filter,所以这里捕获的包很多，比如 UDP 的包、ARP 的包，我们在这里检查包是否是 TCP 包，如果不是，我们忽略这个包。当然最好是一开始就设置 filter，性能会更好。

接下来我们解析 TCP 选项中的时间戳：

        let ts = tcp.options().find_map(|option| {
            match option {
                TcpOption::Timestamp{val,ecr} => {
                    Some((val, ecr))
                }
                _ => None
            }
        });

        if ts.is_none() {
            continue;
        }

        if ts.unwrap().1 == 0 && !tcp.syn(){
            continue;
        }

pdu库的好处是方便解析 TCP 以及它的选项。TCP 的选项可能有好几个，我们只 match 时间戳的那个，得到时间戳的值和 echo reply 的值。接下来我们处理数据。首先根据五元组和tval为 key,将这个 flow 的信息存储到 map 中：

        let key = format!("{}:{}->{}:{}-{}",  src_ip, tcp.source_port(),dst_ip,tcp.destination_port(),ts.unwrap().0);
        if !map.contains_key(key.as_str()) {
            map.insert(key, packet.header.ts);
        }

然后我们找反向的 key,如果存在，就说明有去向，当前处理的是回向，我们计算两个捕获的值的差，就是时延：

        let reverse_key = format!("{}:{}->{}:{}-{}", dst_ip, tcp.destination_port(),src_ip,tcp.source_port(),ts.unwrap().1);
        if map.contains_key(reverse_key.as_str()) {
            map.get(reverse_key.as_str()).map(|ts| {
                let rtt = timeval_diff_str(ts,&packet.header.ts);
                println!("{} {} {}:{}->{}:{}", timeval_to_current_time_str(&packet.header.ts), rtt,dst_ip, tcp.destination_port(),src_ip,tcp.source_port());
            });
        }

当然为了避免map中的数据越积越多，我们可以定期清理一下，这里我们根据 map 中的元素的数量决定要不要清理：

        if map.len() > 10_000 {
            map.retain(|_,v| {
                let now = std::time::SystemTime::now();
                let duration = now.duration_since(UNIX_EPOCH).unwrap();
                let ts = Duration::new(v.tv_sec as u64, v.tv_usec as u32 * 1000);
                duration.sub(ts).as_secs() < 60
            });
        }

然后补充两个计算时间的辅助程序，这就是这个程序的全部代码了:

fn timeval_to_current_time_str(tv: &libc::timeval) -> String {
    let secs = tv.tv_sec as u64;
    let nsecs = (tv.tv_usec as u32 * 1000) as u64;

    let duration = UNIX_EPOCH + std::time::Duration::new(secs, nsecs as u32);
    let datetime = DateTime::<Local>::from(duration);

    datetime.format("%H:%M:%S").to_string()
}

fn timeval_diff_str(start: &libc::timeval, end: &libc::timeval) -> String {
    let secs = end.tv_sec as i64 - start.tv_sec as i64;
    let usecs = end.tv_usec as i64 - start.tv_usec as i64;
    let (secs, usecs) = if usecs < 0 {
        (secs - 1, usecs + 1_000_000)
    } else {
        (secs, usecs)
    };

    format_duration(secs, usecs as u32)
}

fn format_duration(secs: i64, usecs: u32) -> String {
    let duration = secs * 1_000_000 + usecs as i64;
    match duration {
        0..=999_999 => format!("{:.3}ms", duration as f64 / 1_000.0),
        _ => format!("{:.6}s", duration as f64 / 1_000_000.0),
    }
}

你对 Rust 实现的 pping 有什么看法，欢迎在评论区留下你宝贵的意见。

参考资料
[1]pcap: https://crates.io/crates/pcap
[2]pdu: https://docs.rs/pdu/latest/pdu/
[3]pnet: https://github.com/libpnet/libpnet
[4]etherparse: https://crates.io/crates/etherparse

 用户评论

Rust编程
 49 成员 |  328 话题
+我要提问 +随便写写

可能感兴趣的话题

内存安全编程趋势转变，Rust 应用增长陷入停滞

Rust做为后端开发语言的不足与改进

Rust中使用Rayon并行计算库快速提示程序性能

为什么Rust是你学习编程的不二语言？