网桥原理及源代码详解
* 解析ie_minix */[color=green]/* 概述:
* 该代码在FB中提供桥接功能,不过他只是在以太网接口上工作,能提供多个逻辑桥
* ,我们称为组,组是由一组有相同组ID的接口组成,组ID的范围在1到2^16-1之间.
* 打开桥的功能是通过sysctl net.link.ether.bridge=1来启动的.
* 而sysctl net.link.ether.bridge_cfg是把以太网接口进行分组的命令,如:
* sysctl net.link.ether.bridge_cfg="vr0:1,vr1:1,fxp0:2,fxp1:2" 该命令的结果
* 为网卡vr0和vr1可以进行相互通信,fxp0和fxp1之间可以互相转发,等于是分为俩组了.
* 但目前的该项设置还不能进行多组成员和单向控制,即一块卡可以为多个组的成员和某卡
* 与另外卡的数据单向流动.在本文中,我将结合代码来讲解如何实现以上的功能.
* 在本代码中,重要的数据结构是cluster_softc,他主要是记录一个组的接口所连接的机器
* 的硬件地址,该地址数组存储采用HASH算法,据我所知,4.4版和OpenBSD版的HASH函数算法根本不同,
* 我们在下面的代码分析过程中将看到,我也将讲解两个版本的不同之处,说实话,该算法我根本看
* 不懂(OpenBSD),估计该算法应该有相关的论文描述.
* 代码的学习顺序:
* 由于在if_ethersubr.c中的ether_input函数接到一数据包后,先查看bridge功能是否打开,
* 即判断全局变量do_bridge是否为1(该变量是由上面讲的sysctl来控制的),为真的话就调用
* 本文中的函数bridge_in(详细可看我写的"ethernet网络驱动代码详解"),所以在本文中的
* bridge_in函数是第一个被调用的.该函数的作用是在上面讲的哪个重要的数据结构中查找
* 目标地址要通过本机的哪块卡发送,当然其中还涉及到多播,广播和是否将网卡进行分组以
* 及是否发送方,目的方经过的本机网卡是否被分在同组中等,在完成后,如果成功找到了发送
* 到目的地机器和本机直接相连的网卡就返回该网卡的ifnet结构指针(该结构可连接所描述的卡
* 的所有信息,见我所写的"关于FreeBSD4.4网络源代码接口层数据结构ifnet分析说明"),然后
* if_ethersubr.c中的ether_input函数还要查看是否是发给本机的包,如果不是则调用本文的
* bridge_forward函数进行数据的转发,这就是本文的主要功能.和交换机的原理有点类似.
* 性能分析:
* 由于在进行桥转发的过程中,是一定要使网卡工作在混杂模式的,所以进行网桥工作的卡要选购
* 性能好的网卡,我个人觉得intel,3com等比较适合,其他的如rtl8139卡最好只用来做实验,不要
* 用于实际的工作中(如果要我说明原因,请看看他的驱动程序你就知道了,但单机上网没关系),另
* 外,PCI漕内不要其他的卡(如声卡等),我们知道,网卡驱动程序目前在BSD中工作于中断驱动模式,
* 也就是说,进来一个包就能产生一个中断,而中断的系统开销有多达大家可以查看内核代码,总之
* 是非常大,如果你是四块卡,而且担任网桥及一些过滤功能的话,肯定数据包通过量会比较大,那么
* 中断产生的频率是平常一块卡的十几甚至是几十倍(平常的卡一个是数据量不大,另一个是不在混
* 杂模式下).要想桥工作的效率提高,建议去除本机处理针对本机的高层协议处理,如IP协议等,或改
* 写驱动程序为半轮询模式(使用timeout读卡的数据是否到达),OpenBSD中的bridge是真正的把bridge做
* 为一个设备来编写的,配备了标准的设备驱动程序,不过我还没有完全分析过,大概的看了看,觉得
* 比FreeBSD中的桥功能要强很多啊!
* 如何驱动一个网桥:
* 首先在内核配置文件中加入以下一行:
* option BRIDGE
* 注:我所使用的4.4版本是必须的,当前版本不需要这样,可以kld动态加载.
* 重新编译核心后重启,使用 sysctl net.link.ether.bridge=1启动桥功能.
* 如果想把网卡编组,使用 sysctl net.link.ether.bridge_cfg="设备:组号,设备:组号,..."即完成.
*/[/color]/*
* 此处略去BSD版权申明
*/
#include <sys/param.h>
#include <sys/mbuf.h>
#include <sys/malloc.h>
#include <sys/protosw.h>
#include <sys/systm.h>
#include <sys/socket.h>
#include <sys/ctype.h>
#include <sys/kernel.h>
#include <sys/sysctl.h>
#include <net/pfil.h>
#include <net/if.h>
#include <net/if_types.h>
#include <net/if_var.h>
#include <netinet/in.h>
#include <netinet/in_systm.h>
#include <netinet/in_var.h>
#include <netinet/ip.h>
#include <netinet/if_ether.h>
#include <net/route.h>
#include <netinet/ip_fw.h>
#include <netinet/ip_dummynet.h>
#include <net/bridge.h>
/*--------------------*/
#define HASH_SIZE 8192 /* HASH表的大小,必须是2的权数 */
/*hash表,该表存放与本机各块卡相连机器的硬件地址*/
typedef struct hash_table {
struct ifnet * name; /*与某机器相连的本机网卡的ifnet结构指针*/
u_char etheraddr[6]; /*某台机器的硬件地址*/
u_int16_t used; /*这是一个是否在用(某机器是否活动)的标志*/
} bdg_hash_table ;
/*
*哈稀函数,我不理解他的算法,难道这样就不会产生同义字了吗?
*/
#define HASH_FN(addr) ( \
ntohs( ((u_int16_t *)addr)[1] ^ ((u_int16_t *)addr)[2] & (HASH_SIZE -1))
/*
* 下面的结构存储了本机的各卡的硬件地址.
*/
struct bdg_addr {
u_char etheraddr[6] ;/*本机卡的硬件地址*/
u_int16_t _padding ;/*这个成员还象没看到他用过*/
};
/*
* 这就是我们上面说的组,每块卡都有一个cluster_softc结构
*/
struct cluster_softc {
u_int16_t cluster_id; /*组的ID号*/
u_int16_t ports;/*顺序号*/
bdg_hash_table *ht;/*和该卡所连接的机器MAC地址哈稀表首指针*/
struct bdg_addr *my_macs; /* 本卡的硬件地址 */
};
extern struct protosw inetsw[]; /* 在netinet/ip_input.c中 */
extern u_char ip_protox[]; /* 在netinet/ip_input.c中 */
static int n_clusters; /* 组的数量*/
static struct cluster_softc *clusters; /*定义一个组的全局初始指针*/
#define BDG_MUTED(ifp) (ifp2sc[ifp->if_index].flags & IFF_MUTE) /*检查本机某卡是否桥启用*/
#define BDG_MUTE(ifp) ifp2sc[ifp->if_index].flags |= IFF_MUTE /*禁止本机的该卡桥功能*/
#define BDG_CLUSTER(ifp) (ifp2sc[ifp->if_index].cluster)/*根据卡在核心的唯一序号定位他的cluster_softc结构指针*/
#define BDG_SAMECLUSTER(ifp,src) \
(src == NULL || BDG_CLUSTER(ifp) == BDG_CLUSTER(src) /*俩卡是否在同一组里?*/
/*src==NULL代表数据包来自ether_output函数.*/
#ifdef __i386__
/*比较两个地址是否相同,硬件地址是6个字节,所以他先比较后面的长字(4个字节),再比较前一个字(2个字节)*/
#define BDG_MATCH(a,b) ( \
((u_int16_t *)(a))[2] == ((u_int16_t *)(b))[2] && \
*((u_int32_t *)(a)) == *((u_int32_t *)(b))
/*以下是比较广播地址*/
#define IS_ETHER_BROADCAST(a) ( \
*((u_int32_t *)(a)) == 0xffffffff && \
((u_int16_t *)(a))[2] == 0xffff
#else
/* 非i386的机器不一定按长字或字对齐,所以按字节的方式比较. */
#define BDG_MATCH(a,b) (!bcmp(a, b, ETHER_ADDR_LEN)
#define IS_ETHER_BROADCAST(a) (!bcmp(a, "\377\377\377\377\377\377", 6))
#endif
/*
*以下两句是调试用的.
*/
#define DDB(x) x
#define DEB(x)
static int bdginit(void);/*申明bridge初始化函数*/
static void parse_bdg_cfg(void);/*申明sysctl的字符参数分解函数