云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > C++中汉字字符串的截取

C++中汉字字符串的截取

  • 62 次阅读
  • 3 次下载
  • 2025/6/5 13:42:57

1、

复制代码 代码如下:

const char *str = \测试test\while(*str) {

//这里只需要判断第一个字节大于0x80就行了,前提是输入的是合法的GBK字符串 //原因在于,如果第一个字节大于0x80,那么它必然和后面一个字节一起组成一个汉字 //所以就没有必要再去判断后面一个字节了 //再强调一下,前提条件是输入合法的GBK字符串 if(*str> 0x80) {

// 汉字,计数器++

str += 2;//是汉字自然就该直接+2了 } else { str++; } }

2、

参看下面的字符串转换函数。

复制代码 代码如下:

/**

* 用getBytes(encoding):返回字符串的一个byte数组 * 当b[0]为 63时,应该是转码错误 * A、不乱码的汉字字符串:

* 1、encoding用GB2312时,每byte是负数; * 2、encoding用ISO8859_1时,b[i]全是63。

* B、乱码的汉字字符串:

* 1、encoding用ISO8859_1时,每byte也是负数; * 2、encoding用GB2312时,b[i]大部分是63。 * C、英文字符串

* 1、encoding用ISO8859_1和GB2312时,每byte都大于0; * 总结:给定一个字符串,用getBytes(\* 1、如果b[i]有63,不用转码; A-2

* 2、如果b[i]全大于0,那么为英文字符串,不用转码; B-1 * 3、如果b[i]有小于0的,那么已经乱码,要转码。 C-1 */

private static String toGb2312(String str) { if (str == null) return null; String retStr = str; byte b[]; try {

b = str.getBytes(\

for (inti = 0; i 0) continue;//2

else if (b1 < 0) { //不可能为0,0为字符串结束符 retStr = new String(b, \break; } }

} catch (UnsupportedEncodingException e) { // e.printStackTrace(); }

return retStr; }

3、

复制代码 代码如下:

unsigned char *str = \测试test\int length; inti;

length = strlen(str);

for (i = 0; i< length - 1; i++) {

if ( *str>= 0x81 && *str<= 0xFE

&& *(str + 1) >= 0x40 && *(str + 1) <= 0xFE) { // 汉字 } }

unsignedchar*str=\测试test\把字符串换成“汉A”试试,结果为2

有人说:“一个GBK汉字要占两个char空间(二字节),而且第一个字节里的值是小于0的。可以据此判断是否为汉字。” 1、为什么第一个字节的值小于0呢?

2、如果仅通过判断第一个字节如果小于0,则该字节和下一个字节就组成一个汉字,这种逻辑是否保险?

3、因为还看到有人说,GBK编码的汉字有高位和低位两位,第一个是低位吧?需要第一个字节在160-254之间,第二个字节在64-254之间,这样是不是比2中提到的方法要保险? 4、如果DB中的字符集是SIMPLIFIED CHINESE_CHINA.ZHS16GBK,这个是GBK字符集?GBK兼容GB2312

似乎有些字符集中有些汉字占三个字节

“通过判断第一个字节如果小于0,则该字节和下一个字节就组成一个汉字”

搜索更多关于: C++中汉字字符串的截取 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

1、 复制代码 代码如下: const char *str = \测试test\while(*str) { //这里只需要判断第一个字节大于0x80就行了,前提是输入的是合法的GBK字符串 //原因在于,如果第一个字节大于0x80,那么它必然和后面一个字节一起组成一个汉字 //所以就没有必要再去判断后面一个字节了 //再强调一下,前提条件是输入合法的GBK字符串 if(*str> 0x80) { // 汉字,计数器++ str += 2;//是汉字自然就该直接+2了 } else { str++; } } 2、 参看下面的字符串转换函数。 复制代码 代码如下: /** * 用getBytes(encoding):返回字符串的一

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com