Java出现个别中文字符乱码问题

如果你发现HttpClient获取下来的内容个别字符是乱码的,别慌,这种情况很可能页面编码是GB2312的,但是某个汉字编码不在GB2312里面,所以采用GBK或者GB18030对字符串进行处理就行了,另外这种情况不要使用EntityUtils.toString去处理,因为它内部实现有个1024的buffer操作,毕竟老外写得库,不会考虑中文。使用BufferedReader按行读取,或者使用ByteArrayOutputStream一次性全部读取再进行字符串编码处理。...

阅读全文

主机推荐

  • 搬瓦工

站点信息

  • 文章总数:655
  • 页面总数:1
  • 分类总数:11
  • 标签总数:2555
  • 评论总数:135
  • 浏览总数:3428471