采集搜索框信息补全的数据

我自己的地名库不是很全,想从淘宝的api中采集地名,用到自己的搜索框补全信息中。
http://dujia.trip.taobao.com/ajax/TravelSuggest.htm?q= 这个是接口地址,返回的是json(编码是gb2312,需要先转换下编码)
淘宝的地名提示的匹配方法是模糊匹配法,所以我想尽可能全的采集下来,但估计重复数据会比较大,所以想问下,有没有什么好的思路。谢谢

查看回复