如果你发现HttpClient获取下来的内容个别字符是乱码的,别慌,这种情况很可能页面编码是GB2312的,但是某个汉字编码不在GB2312里面,所以采用GBK或者GB18030对字符串进行处理就行了,另外这种情况不要使用EntityUtils.toString去处理,因为它内部实现有个1024的buffer操作,毕竟老外写得库,不会考虑中文。使用BufferedReader按行读取,或者使用ByteArrayOutputStream一次性全部读取再进行字符串编码处理。
Java出现个别中文字符乱码问题
内容版权声明:除非注明,否则皆为本站原创文章。
转载注明出处:https://11000011.com/?id=15
我要评论