你看到网页中有一个具有完整国家地区列表下拉框,或是一个完整的时区下拉框,是否考虑过把它的数据保存到自己的数据库呢?今天正好遇到这个问题,想了一个解决办法,基本思路如下:
1、获得下拉列表框的 HTML 代码
2、转换 HTML 代码为 CSV 格式的文件
3、在数据库中导入这个 CSV 文件
获取下拉框的 HTML 代码有很多方法,比如直接复制需要的 HTML 源代码,或者直接在网页上复制下拉列表框,然后粘贴到一 HTML 编辑器中(Dreamweaver 或 FCKeditor),就可以得到源代码了,或者用 IE 的一个小插件 Instance Source 得到选区的源代码。
这里关键是第 2 步——如何从得到的 HTML 可提取有效数据。分析包含数据的行,往往这样的:
<option value="1">United States</option>
可以让 EditPlus 来提取需要的数据。把代码复制到 EditPlus 打开的文本文件中去。首先删除多余的行,然后按 Ctrl+H 打开 Replace 对话框。查找<option value="([0-9]+)">(.+)</option>
替换为\1,\2
复选 Use Regular Expression 以使用正则表达式的方式来查找和替换。按 Replace All 按钮,瞬间就得到了一个 CSV 格式的文件。
最后一步就不说了,呵呵,用 MSSQL 的 DTS 或 Access 的导入数据可以轻松完成。
如果数据暂时用不上,可以先把 CSV 文件保存起来备用。