前段时间在 atppp 的博客上读到了“纪念一个 Bug”,这让我想起了 OpenWRT 开源固件上面关于 Broadcom 交换芯片的一个 bug,所以也来写个文章纪念一下。
1. Linksys 开源路由器固件的起源和发展
OpenWRT 这个项目最早起源于 Linksys 的 WRT54G 家用无线路由器固件。WRT54G 这款无线路由器(台灣同胞稱作“無線基地台”或者“無線IP分享器”)是 2003 年 802.11g 无线网络兴起时在家用领域的领军人物,引来叫好一片。于是有人研究了它的软件系统,赫然发现它是一个基于 Linux 的嵌入式系统。所以根据 GPL 这一个病毒一样的协议要求 Linksys 开放源代码。Linksys 架不住压力,于是根据 GPL 开放了源代码(现在还可以在 Linksys 的网站上下载)。这一开放,就使得第三方固件雨后春笋一般蓬勃发展起来。OpenWRT 是最特别的一个。因为别家都是在 Linksys 的源代码基础上添砖加瓦,唯有 OpenWRT 是重新构造一个完整功能的路由器固件。
然而做 OpenWRT 的都是一群高人,他们注重扩展性、可定制性却忽视了普通大众的需求。做出来的东西只能用命令行玩玩,这让习惯从浏览器里配置无线路由器的劳苦大众无所适从。所以后来有了 Seavsoft 做了收费但带有 Web UI 的固件,再后来又有了 DD-WRT,DD-WRT 从 v23 的成熟发展到今天 v24 sp2 的功能多样而不失易用性,的确为开源无线路由器的发展立下了汗马功劳。
Tomato 是 DD-WRT 之外异军突起的一个优秀固件。它注重于简单、实用、高效,并且以优雅的 AJAX Web UI 和高效的 QoS 功能赢得了广泛支持。作者原来是 HyperWRT 开发小组的一员,后来跑出来自立门户开发 HyperWRT + Tofu 固件,就演变成了今天的 Tomato Firmware 。
(汗 说了个背景就说了这么多!)
2. 关于 802.1X 认证的 bug
因为面向家用和小企业市场,家用路由器的连接方式主要是 PPPoE 和 LAN 接入。但是现在众多学校等接入单位觉得对于 LAN 接入不方便对用户的控制和管理,于是把原本为无线网络设计的 802.1X 认证体系引入到了 LAN 网络中。802.1X 是一个二层的访问控制协议,用户只有认证之后,交换机才开放相应的端口,允许用户接入。这就是传说中的“基于端口”的管理。
众多学校引入了 IEEE 802.1X 之后,导致市面上的家用无线路由统统作废,因为这些设备压根就没有支持 802.1X 这回事(当然现在国内的 TP-LINK 已经顺应国情推出了支持 802.1X 认证的产品)。更可恶的是,国内的锐捷、H3C 推出了802.1x 的自有扩展协议,只能使用自己研制的客户端上网。而这些客户端无一例外地“附赠”了禁止NAT、多网卡的功能。妄图以多角度、多手段来扼杀同学们突破限制的种种企图。
俗话说“道高一尺,魔高一丈”,又说“上有政策,下有对策”,Linux 版本的 802.1x 客户端也自然而然的产生了。而开源固件又正好是基于 Linux 制作的。这些小路由器们个个都有支持 MIPS 指令集的 CPU,外加 4-32 MB 不等的 Flash ROM 和 RAM,本身就是一个五脏俱全的嵌入式 Linux 系统。这样就可以想办法将认证程序移植到开源固件中。
我去买了个 Buffalo WHR-G125 ,在 Ubuntu Linux 下半生不熟地用交叉编译工具编译出学校校园网的认证程序 mytunet,满怀希望地放上去跑,没想到程序一直停滞在“Send logon request …” 这一步,压根没有收到服务器的响应。但把网线换到 PC 上又可以正常登录。看来是某个地方有问题了。
后来在 Google 上使劲搜,终于找到了问题的原因,OpenWRT 的 Trac 上有两个编号为 1687 和 1862 的 Ticket 说明了这个问题。
1687 放出来以后,人家没仔细看就把这个 ticket 关掉了,后面又有人 reopen ,然后再度被关闭。如此往复了几次,就晾在那没人理了。
1862 就更无奈了,Bug 放出来一年没有人理,四楼的哥们一怒之下来了一段抱怨的话:
Judging the fact that this bug is now lingering on for more than a year (since I first pointed it out) and the zero respons from the openwrt team, I came to the understanding that the openwrt team is more interested in fancy apps than a good working tcp stack. Shame shame shame.
俺七个月以前看到这个状态的时候,也觉得很无奈。人家开发者压根不鸟你,只好自己也参与讨论,然后以 Scott Liu 的身份在上面用蹩脚的英语提了提自己的意见完事。
后来把这个路由器在水木二手版上折价买掉了,360买回来的东西拿回来没过十天转出去的时候就是 260 了,价格掉得真快。期间有幸得到康神的指导,倍感荣幸。神说俺体察了一下网络上的民情,发现这是 Broadcom 交换芯片的硬伤,只是俺精力不如从前没工夫去 patch 了,你把它出掉是明智的。神又给我指了一条明路,说神自己的 Dell TrueMobile 2300 可以发送和接收 EAP 认证包,不存在上面的问题,指示我去买一个使用了 6996L 交换芯片的机器就没问题。
幸得神助,又在淘宝上淘了一个 Linksys WRT54GS v1.1 v1.0 (感谢 hyspace 指正) ,序列号以 CGN1 开头,特意跟店家确认了是 6996L 交换芯片。拿回来刷好固件,试了试,果然毫无问题地通过了校园 802.1X 认证!回来跟康神报告,神 cong 了一下又很谦虚地说“其实原因你自己之前也说了……”云云。向 atppp 学习随时随地拜康神!
买到了没有 bug 的硬件,这个问题基本上靠以段落了。下一段的 bugfix 又是后话。