首頁技術(shù)文章正文

黑馬程序員C/C++培訓(xùn)專家:C++中GB2312字符串和UTF-8之間的轉(zhuǎn)換

更新時(shí)間:2017-11-21 來源:黑馬程序員 瀏覽量:

在編程過程中需要對(duì)字符串進(jìn)行不同的轉(zhuǎn)換,特別是Gb2312和Utf-8直接的轉(zhuǎn)換。在幾個(gè)開源的魔獸私服中,很多都是國外開發(fā)的,而暴雪為了能夠兼容世界上的各個(gè)字符集也使用了UTF-8。在中國使用VS(VS2005以上版本)開發(fā)基本都是使用Gb2312的Unicode字符集,所以當(dāng)在編程過程中就需要進(jìn)行字符轉(zhuǎn)換,這樣才能兼容游戲,否則就是亂碼。而在控制臺(tái)顯示字符串時(shí),正好相反需要將UTF-8的字符串轉(zhuǎn)換成Gb2312才能正常顯示。

為了解決這個(gè)問題,轉(zhuǎn)換如下;其實(shí)很多地方都可以使用到字符串的編碼轉(zhuǎn)換,代碼如下:


//UTF-8到GB2312的轉(zhuǎn)換  
char* U2G(const char* utf8)  
{  
int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0);  
wchar_t* wstr = new wchar_t[len+1];  
memset(wstr, 0, len+1);  
MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);  
len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL,   NULL);  
char* str = new char[len+1];  
memset(str, 0, len+1);  
WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL);  
if(wstr) delete[] wstr;  
return str;  
}  
 
//GB2312到UTF-8的轉(zhuǎn)換  
char* G2U(const char* gb2312)  
{  
int len = MultiByteToWideChar(CP_ACP, 0, gb2312, -1, NULL, 0);  
wchar_t* wstr = new wchar_t[len+1];  
memset(wstr, 0, len+1);  
MultiByteToWideChar(CP_ACP, 0, gb2312, -1, wstr, len);  
len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL,  NULL);  
char* str = new char[len+1];  
memset(str, 0, len+1);  
WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL);  
if(wstr) delete[] wstr;  
return str;  
}  

 無論是GB2312到UTF-8的轉(zhuǎn)換,還是UTF-8到GB2312的轉(zhuǎn)換,都需要注意的是在使用字符串后,需要?jiǎng)h除字符串指針;這是因?yàn)橐陨蟽蓚€(gè)方法返回的是字符串指針,如果沒有刪除將會(huì)內(nèi)存泄漏,可別說我沒提醒你哦。


本文版權(quán)歸黑馬程序員C/C++學(xué)院所有,歡迎轉(zhuǎn)載,轉(zhuǎn)載請注明作者出處。謝謝!


作者:黑馬程序員C/C++培訓(xùn)學(xué)院


首發(fā):http://c.itheima.com/


分享到:
在線咨詢 我要報(bào)名
和我們在線交談!