2013年10月23日 星期三

如何模糊搜尋Impact Factor


有些同學看了上一篇查詢IF值的教學還是有問題,因為Web of Knowledge網站是不支援模糊搜尋的,如果遇到名稱是縮寫的時候,很有可能就找不到該篇文獻,以下就要教大家搭配維也納大學的網站來進行搜尋唷。

要用到的有這兩個網站:
1. InCites™ Journal Citation Reports®網站:http://jcr.incites.thomsonreuters.com/
2. 維也納大學SCI/SSCI查詢網站:http://publik.tuwien.ac.at/info/sci_search.php

首先請到維也納網站查詢期刊名稱(例如:The Royal Society B),因為搜尋引擎具備模糊搜尋能力,所以很容易可以找到期刊全名以及ISSN代碼:


接著到JCR網站(如何進入請參考這篇)搜尋條件選擇ISSN的方式將ISSN代碼填入後進行搜尋:


最後就會看到縮寫的期刊名稱及Impact Factor資訊囉!!
註: Conference通常沒有Vol.跟No. No.等同於Issue Symposium 小型研討會

2013年8月27日 星期二

MFC OpenGL Chapter 2

線架構:


面:


OpenGL繪製面範例:
http://codeboxy.blogspot.com/2013/08/mfc-draw-face-using-opengl.html

OpenGL繪製面並打光範例:
http://codeboxy.blogspot.com/2013/08/mfc-draw-face-and-lighting-using-opengl.html

Binary STL模型:
小齒輪 (FileName: GearASCII.STL, Facet Normal: 792, Vertex: 2376, Diameter: 10mm)
https://sites.google.com/site/ccuboxy/home/GearBinary.STL?attredirects=0&d=1

大齒輪 (FileName: LargeGearASCII.STL, Facet Normal: 792, Vertex: 2376, Diameter: 100mm)
https://sites.google.com/site/ccuboxy/home/LargeGearBinary.STL?attredirects=0&d=1

風扇 (FileName: FanASCII.STL, Facet Normal: 2928, Vertex: 8784, Diameter: 80mm)
https://sites.google.com/site/ccuboxy/home/FanBinary.STL?attredirects=0&d=1

參考網站:
NeHe英文 - http://nehe.gamedev.net/
NeHe繁體中文(僅部分翻譯) - http://reocities.com/SiliconValley/vista/8177/tutorial/nehe.htm

2013年7月15日 星期一

Advanced VC++ Chapter 3

課程內容:

拖曳方式讀取檔案
http://codeboxy.blogspot.com/2013/07/drag-to-read-file.html

例外處理的方法
http://codeboxy.blogspot.com/2013/07/exception-handling.html

GD繪圖函式
http://codeboxy.blogspot.com/2013/07/simple-drawing-using-gd-libary.html

GD Library DL(DLL在bin資料夾內):
https://sites.google.com/site/ccuboxy/home/gd-latest-win32.zip?attredirects=0&d=1

作業3:
撰寫一程式,能拖曳一座標資料文字檔,進行繪圖動作產生一圖片檔。

作業參考解答:
http://codeboxy.blogspot.com/2013/07/read-stl-model-file-and-export-graphics.html

範例結果:




ASCII STL模型:

球 (FileName: SphereASCII.STL, Facet Normal: 2352, Vertex: 7056, Diameter: 1mm)
https://sites.google.com/site/ccuboxy/home/SphereASCII.STL?attredirects=0&d=1

小齒輪 (FileName: GearASCII.STL, Facet Normal: 792, Vertex: 2376, Diameter: 10mm)
https://sites.google.com/site/ccuboxy/home/GearASCII.STL?attredirects=0&d=1

大齒輪 (FileName: LargeGearASCII.STL, Facet Normal: 792, Vertex: 2376, Diameter: 100mm)
https://sites.google.com/site/ccuboxy/home/LargeGearASCII.STL?attredirects=0&d=1

風扇 (FileName: FanASCII.STL, Facet Normal: 2928, Vertex: 8784, Diameter: 80mm)
https://sites.google.com/site/ccuboxy/home/FanASCII.STL?attredirects=0&d=1

2013年7月10日 星期三

Advanced VC++ Chapter 2

課程內容:

使用正規表示法取得數值
http://codeboxy.blogspot.com/2013/07/get-value-using-regular-expression.html

使用一維陣列傳入函式的方式進行一維陣列的處理
http://codeboxy.blogspot.com/2013/07/passing-array-to-function.html

函式使用指標的方式傳值進行運算處理
http://codeboxy.blogspot.com/2013/07/passing-two-dimensional-array-to.html

矩陣相乘範例
http://codeboxy.blogspot.com/2013/07/passing-two-dimensional-array-to_10.html

作業二:
撰寫一程式,能讀取矩陣資料並存入二維陣列中,請建立一副函式可供反矩陣運算並能將結果回傳主函式,最後直接印出逆矩陣的答案。

作業範例結果:


作業參考答案:
http://codeboxy.blogspot.com/2013/07/solving-matrix-inverse-using-pointer.html

作業答案驗證:


範例二維陣列:
int arr[2][4] = {
    {1, 2, 3, 4},
    {5, 6, 7, 8}
}
陣列在記憶體中的排列方式:
陣列資料
..
..
..
arr[0][0]1
arr[0][1]2
arr[0][2]3
arr[0][3]4
arr[1][0]5
arr[1][1]6
arr[1][2]7
arr[1][3]8
..
..
..

2013年7月9日 星期二

Advanced VC++ Chapter 1

課程內容:

字串轉換範例:
http://codeboxy.blogspot.com/2013/07/string-conversion.html

文字檔案讀取與寫入:
http://codeboxy.blogspot.com/2013/07/two-ways-to-read-and-write-files.html

正規表示法字串處理:
http://codeboxy.blogspot.com/2013/07/using-regular-expression-in-cc.html

參考網站:
C++學習筆記
MSDN Regex - Regular Expressionsregex_matchregex_searchregex_replace

作業一:
撰寫一STL讀檔程式,能夠逐行讀取ASCII STL模型資料,並逐行檢查整筆檔案的資料格式是否正確,最後印出的結果。
(註1: 在整筆資料中,任何一行資料格式錯誤都必須及時跳出迴圈,並顯示格式錯誤的訊息。
註2: 每次作業都請在下次上課時繳交,並會檢討作業並給予範例解答。)

作業範例輸出:

ASCII STL模型:

四角錐 2x2x2 (TriangleASCII.STL)


立方體 2x2x2 (CubeASCII.STL)


作業參考解答:
http://codeboxy.blogspot.com/2013/07/check-ascii-format-of-stl-file.html

正規表示法參考指令列表:
字元描述
\將下一個字元標記為一個特殊字元、或一個原義字元、或一個向後引用、或一個八進位轉義符。例如,「n」匹配字元「n」。「\n」匹配一個換行符。序列「\\」匹配「\」而「\(」則匹配「(」。
^匹配輸入字元串的開始位置。如果設置了RegExp對象的Multiline屬性,^也匹配「\n」或「\r」之後的位置。
$匹配輸入字元串的結束位置。如果設置了RegExp對象的Multiline屬性,$也匹配「\n」或「\r」之前的位置。
*匹配前面的子表達式零次或多次。例如,zo*能匹配「z」以及「zoo」。*等價於{0,}。
+匹配前面的子表達式一次或多次。例如,「zo+」能匹配「zo」以及「zoo」,但不能匹配「z」。+等價於{1,}。
?匹配前面的子表達式零次或一次。例如,「do(es)?」可以匹配「do」或「does」中的「do」。?等價於{0,1}。
{n}n是一個非負整數。匹配確定的n次。例如,「o{2}」不能匹配「Bob」中的「o」,但是能匹配「food」中的兩個o。
{n,}n是一個非負整數。至少匹配n次。例如,「o{2,}」不能匹配「Bob」中的「o」,但能匹配「foooood」中的所有o。「o{1,}」等價於「o+」。「o{0,}」則等價於「o*」。
{n,m}mn均為非負整數,其中n<=m。最少匹配n次且最多匹配m次。例如,「o{1,3}」將匹配「fooooood」中的前三個o。「o{0,1}」等價於「o?」。請注意在逗號和兩個數之間不能有空格。
?當該字元緊跟在任何一個其他限制符(*,+,?,{n},{n,},{n,m})後面時,匹配模式是非貪婪的。非貪婪模式儘可能少的匹配所搜索的字元串,而預設的貪婪模式則儘可能多的匹配所搜索的字元串。例如,對於字元串「oooo」,「o+?」將匹配單個「o」,而「o+」將匹配所有「o」。
.匹配除「\n」之外的任何單個字元。要匹配包括「\n」在內的任何字元,請使用像「[.\n]」的模式。
(pattern)匹配pattern並獲取這一匹配。所獲取的匹配可以從產生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中則使用$0…$9屬性。要匹配圓括號字元,請使用「\(」或「\)」。
(?:pattern)匹配pattern但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以後使用。這在使用「或」字元(|)來組合一個模式的各個部分是很有用。例如,「industr(?:y|ies)就是一個比」industry|industries'更簡略的表達式。
(?=pattern)正向預查,在任何匹配pattern的字元串開始處匹配查找字元串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如,「Windows(?=95|98|NT|2000)」能匹配「Windows2000」中的「Windows」,但不能匹配「Windows3.1」中的「Windows」。預查不消耗字元,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字元之後開始。
(?!pattern)負向預查,在任何不匹配pattern的字元串開始處匹配查找字元串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如「Windows(?!95|98|NT|2000)」能匹配「Windows3.1」中的「Windows」,但不能匹配「Windows2000」中的「Windows」。預查不消耗字元,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字元之後開始
x|y匹配x或y。例如,「z|food」能匹配「z」或「food」。「(z|f)ood」則匹配「zood」或「food」。
[xyz]字符集合。匹配所包含的任意一個字元。例如,「[abc]」可以匹配「plain」中的「a」。
[^xyz]負值字符集合。匹配未包含的任意字元。例如,「[^abc]」可以匹配「plain」中的「p」。
[a-z]字元範圍。匹配指定範圍內的任意字元。例如,「[a-z]」可以匹配「a」到「z」範圍內的任意小寫字母字元。
[^a-z]負值字元範圍。匹配任何不在指定範圍內的任意字元。例如,「[^a-z]」可以匹配任何不在「a」到「z」範圍內的任意字元。

研究生與實驗室守則
http://www.csie.nctu.edu.tw/~sltsao/formasterstudents.htm
http://web.ntpu.edu.tw/~tsair/2Research/Adivisor/GoodStudent.htm
http://www.mse.nthu.edu.tw/~jgd/lab/rule/commitment.htm
http://homepage.ntu.edu.tw/~ihliu/student.html
http://www.eecstc.yuntech.edu.tw/yuntecheec/program/mp/Lab/es604/rules.htm

2013年5月27日 星期一

Maxima 矩陣相乘用法

在 Maxima 中矩陣相乘用法

語法:
Raz:matrix(
 [cos(a),-sin(a),0], 
 [sin(a),cos(a),0], 
 [0,0,1]
);
Rby:matrix(
 [cos(b),0,sin(b)], 
 [0,1,0], 
 [-sin(b),0,cos(b)]
);
Rrx:matrix(
 [1,0,0],
 [0,cos(r),-sin(r)],
 [0,sin(r),cos(r)]
);
Rrx.Rby.Raz;
結果:

\begin{bmatrix}\mathrm{cos}\left( a\right) & -\mathrm{sin}\left( a\right) & 0\cr \mathrm{sin}\left( a\right) & \mathrm{cos}\left( a\right) & 0\cr 0 & 0 & 1\end{bmatrix}
\begin{bmatrix}\mathrm{cos}\left( b\right) & 0 & \mathrm{sin}\left( b\right) \cr 0 & 1 & 0\cr -\mathrm{sin}\left( b\right) & 0 & \mathrm{cos}\left( b\right) \end{bmatrix}
\begin{bmatrix}1 & 0 & 0\cr 0 & \mathrm{cos}\left( r\right) & -\mathrm{sin}\left( r\right) \cr 0 & \mathrm{sin}\left( r\right) & \mathrm{cos}\left( r\right) \end{bmatrix}
\begin{bmatrix}\mathrm{cos}\left( a\right) \,\mathrm{cos}\left( b\right) & -\mathrm{sin}\left( a\right) \,\mathrm{cos}\left( b\right) & \mathrm{sin}\left( b\right) \cr \mathrm{cos}\left( a\right) \,\mathrm{sin}\left( b\right) \,\mathrm{sin}\left( r\right) +\mathrm{sin}\left( a\right) \,\mathrm{cos}\left( r\right) & \mathrm{cos}\left( a\right) \,\mathrm{cos}\left( r\right) -\mathrm{sin}\left( a\right) \,\mathrm{sin}\left( b\right) \,\mathrm{sin}\left( r\right) & -\mathrm{cos}\left( b\right) \,\mathrm{sin}\left( r\right) \cr \mathrm{sin}\left( a\right) \,\mathrm{sin}\left( r\right) -\mathrm{cos}\left( a\right) \,\mathrm{sin}\left( b\right) \,\mathrm{cos}\left( r\right) & \mathrm{cos}\left( a\right) \,\mathrm{sin}\left( r\right) +\mathrm{sin}\left( a\right) \,\mathrm{sin}\left( b\right) \,\mathrm{cos}\left( r\right) & \mathrm{cos}\left( b\right) \,\mathrm{cos}\left( r\right) \end{bmatrix}

2013年4月9日 星期二

Visual Studio 的 Unicode 概念

來源:http://www.csie.nctu.edu.tw/~skyang/unicode.zhtw.htm

[轉貼] 萬國碼的概念與專案
萬國碼的概念與專案

甚麼是萬國碼(Unicode)

Unicode 是一套試圖定義全世界文字所用內碼的內碼表,發展的緣由還是字碼的問題,全美國的文字代碼用 ASCII 統一了,那麼國與國之間呢?例如台灣用 Big5 碼,中國大陸用 GB 碼...。自從網際網路開始發達起來,透過網路接觸到不同國家的軟體與內容(content)的機會就變多了,如何讓使用不同國家文字的內容都在同一台電腦上正常顯示呢。

在前篇提過的ASCII碼是由美國國家標準學會所制訂的,供全美國的電腦通訊交換資料的標準內碼,是一種官方標準,而是 Unicode 則是由本部位於加州的國際民間組織制訂的非政府官方標準,主要成員有 Adobe , Apple, HP, IBM, Microsoft, Xerox...自 1991 年發佈第一版以來,至今已經超過十萬字,而且仍在擴充中。

既然目前 unicode 已經超過了 10 萬字,所以必須使用 32 bits 才足夠表示一個 unicode 字元,事實上目前有 UTF-8、UTF-16、UTF-32 版本的 unicode 內碼表,其中 UTF-16 以 16 bits 來儲存一個 unicode 的字元,而 UTF-32 即是以 32 bits 來儲存 unicode 字元,所以 UTF-16 只能儲存一些 unicode 早期的常用字元、例如游錫堃的堃就不在 UTF-16 字碼表中,目前繁體中文在 unicode 裡有 14758 個字,然而 UTF-8 可不是只用 8 bits 來儲存 uncide 字元喔,這是後來發展出的可變長度編碼法,請容後介紹。

電腦中的 Unicode

自從電腦會上網以後,你有很多機會接觸外國軟體,所以 Windows 自 Windows 2000 以後,所有的系統顯示文字內容都以 unicode (UTF-16)為內碼,換言之,你在開始功能表、檔案總管,內附軟體看到的每一個字,都是用 16-bit 的 unicode 字元儲存的, 而Windows內部的文字顯示軟體元件也都是專為顯示 unicode 文字內容而設計,也因此,在 Windows 程式設計中提到的 unicode 或寬字元(wide char)都是指 UTF-16 內碼的字元。

看到這裡你可能會有個問題:既然 Windows用的 unicode 是涵蓋全世界各語言文字的內碼,難道現在的 Windows 電腦都有灌全世界文字的字型?並沒有!所以遇到缺字型的文字,會要求你安裝語言包,然後就可以正常顯示那些異國文字了。

字碼頁(code page)

然而,並不是所有的軟體都已經以 unicode 為內碼,許多軟體還是以 ASCII 或是各國家獨特的內碼顯示的,如果這些舊軟體無法在新版本的 Windows 上執行會造成很大的困擾,但是又無法去強制這些軟體改版的情況下,Windows 採用了一種稱為字碼頁的過渡性機制。

字碼頁(code page)其實是各種內碼轉換到 Unicode的轉碼表,例如台灣用的繁體中文(big-5)就是編號為 950 的字碼頁,當應用程式以非 unicode 的輸出函式、輸出了非 unicode 的文字的時候,Windows會依照系統目前使用中的字碼頁(通常就是各國版本Windows已經預設的字碼頁),將這些文字轉換為 unicode 再輸出之,所以 Windows 在執行這些非 unicode 的程式的時候,事實上是做了內碼轉換才顯示它們的文字的。

除了螢幕上的文字顯示以外,其實檔案存取也是,特別是我們俗稱 ASCII 文字檔的純文字 (plain text)檔案,例如 .txt 檔案,這些檔案本身並不像 .htm 或 .doc 夾帶有邊碼資訊(.htm 的檔頭中告知了這個網頁是採用何種編碼),所以會被系統視為採用各國自己的編碼,所以要把文字從檔案中讀取到 unicode 程式當中的時候,其實也透過了字碼頁將它們轉換為 unicode。

Unicode 應用程式

這麼說來,應用程式似乎分為 unicode 應用程式和非 unicode 應用程式兩種,那麼是否 unicode 程式當中所有的文字就必須採用 unicode 內碼呢?其實不是的,若真是如此的話,那麼所有的 unicode 應用程式都不能採用非 unicode 編碼的舊程式庫(或是由其他平台例如 Linux 移植來的程式庫),那麼麻煩就大了。

其實俗稱的 uincode 應用程式和非 unicode 應用程式,並不是產生的機械碼或撰寫程式時的專案類型有何不同,它們都是「普通的應用程式」,而是 Windows 程式庫當中,所有的文字輸出入、檔案文字輸出入、字串處理函式本來就有 unicode 版本和非 unicode 版本兩套,而俗稱的 unicode 程式則是全面地採用 unicode 版本的輸出入函式,所以是程式寫作技巧的差別而不是軟體本身的差別。

在前篇已經提到 char 類別是 8 bits、以 ASCII 碼做為文字內碼的字元型別,類似地,在 C/C++ 當中另有 16 bits 的 wchar_t 型別用來儲存 16 bits 的 unicode 字元(UTF-16 字元),這種字元在 Windows 程式設計當中也稱為寬字元(wide char), 而採用 char * 字串的處理函式、例如 strcpy( )、也都另有 wchat_t * 版本,例如 wcscpy( ),兩套函式是可以在同一個程式中並用的。

如前所述,俗稱的 unicode 應用程式在程式碼當中,全面地以 wchat_t 代替 char、以 wchat_t 版本的函式來代替 char 版本的函式,例如 strcpy( ) 換成 wcscpy( )、printf( ) 換成 wprintf( )、main( ) 換成 wmain( ),所以這程式輸出入的所有文字內容都是採用 unicode 內碼。以 Visual Studio 來說,如果你有此打算而在新建專案類型的時候勾選了「使用 unicode 程式庫」,它會在建立專案的時候預先為你做好一些額外的初始化動作,所以在主控台程式當中,會以 wmain( ) 來代替 main( ),請見以下的 UniHelloWorld 範例。
#include <stdio.h>

void wmain(void)
{
    wchar_t str[16] = L"Hello World!";
    wprintf(L"%s\n", str);

    char strAsc[16] = "Hello World!";
    printf("%s\n", strAsc);
}
如本例所示,unicode 字元與字串乃以 wchar_t 型別儲存,其實 wchar_t 就是 short int,而在撰寫程式的時候,unicode 字串在 "" 之前加上 L,就指定了此字串在編譯的時候要以 unicode 來儲存,同理,unicode 字元在 ' '前加上L,例如 L ' a'。

在這個例子當中你看到了 unicode 和非 unicode 的字串和函式是可以並存的,此程式的執行結果很單純地如下所示,就是兩行 Hello World! 看似沒有差異,但其實下行的 printf( ) 述句乃是以 ASCII 碼輸出文字的,所以在 Windows 內部其實會經過字碼頁的對應轉換,然後才顯示出來的。

Hello World!
Hello World!

當你在 Visual Studio 的方案總管,在這個 UniHelloWorld 專案上按右鍵\屬性,可以看到字元集選項有使用 unicode 字元集,勾選了以後表示這個專案會使用到 unicode 函式,而且程式中會多出一個 _UNICODE 定義。

如何在程式碼當中得知現在的程式是不是使用 Unicode 的關鍵就是這個 _UNICODE 定義,例如在 UniHelloWorld.cpp 中你可以再加上這樣的程式碼:

#ifdef _UNICODE
wprintf(L"I am using Unicode!\n");
#endif
你可以試著在專案屬性中把字元集改為「使用多位元組字元集」,UniHelloWorld.cpp 就不會顯示這行文字,在 Windows 中 ASCII 也算一種多位元組字元集。


那麼我們要自問:我寫程式的時候應該盡量使用 unicode 字元及其函式嗎?如果你是撰寫 Windows 程式的話,這個答案是 Yes,因為現在的 Windows 都是以 unicode為內碼,你的程式輸出非 unicode 碼都會透過字碼頁轉換為 unicode 再顯示,例如上例中的 printf("Hello World!"); 故以效率起見,應該全面使用 unicode 函式,不過若是其他的平台就無所謂了,因為其他的平台不一定以 unicode 做為系統內碼,甚至可能根本不支援 unicode。

甚麼是 UTF-8

在 Windows 程式當中的 unicode 就是 UTF-16,也就是每個 unicode 字元都用 16 bits 儲存,所以是不太有機會使用到 UTF-8 的,不過在此還是介紹一下。如前所述,在 Windows 當中既然採用了 16 bits 的 UTF-16 內碼,當然所有文字所需的儲存空間都會是 8 bits 的 ASCII 碼的兩倍,就算這些文字內容只是英文與數字構成的也是如此,以目前電腦儲存設備如此便宜的情況下,這點並不是問題,不過若以英文為主的網頁也都以 UTF-16 儲存,導致網路傳輸量都變成兩倍,那問題就很大了,所以發展出了 UTF-8 編碼法(UTF-8 encoding),簡而言之,UTF-8是一種可變長度的字元編碼,前 7-bits 與 ASCII 相同,第 8 個 bit 若為1,後續內碼可能 8~32 bits 不等。

UTF-8 的優點就是和 ASCII 相容,所以舊有的 ASCII 文件或網頁不經任何轉碼,就可以在採用 UTF-8 內碼的閱讀器或瀏覽器上閱讀,當然,UTF-8 的優點就是 UTF-16 的缺點,UTF-16的缺點就是和ASCII不相容,所有的 ASCII 文字內容必須經過轉碼才能夠在 UTF-16 的閱讀器或瀏覽器上閱讀,那麼為甚麼不要連 Windows 都全面採用 UTF-8 呢?因為 UTF-8 是一種「可變長度」的編碼,所以你無法由字數來推斷字串所需的 空間 bytes,這對程式設計來說是非常不便的事情,以程式設計來說,如果你採用 ASCII 內碼,那麼你要儲存 n 個字元的空間就是 n bytes,採用 UTF-16 的話就是 2n bytes,非常容易推斷,但採用 UTF-8 的話就從 n~4n bytes 都有可能,所以到目前為止的 Windows 版本尚不以 UTF-8 為內碼。

本篇重點回顧

您知道了嗎?
Unicode 是一種(試圖)涵蓋全世界的電腦內碼。
Windows已經全面以 UTF-16 做為內碼。
網頁用的 UTF-8 是與 ASCII 相容的一種Unicode內碼。
程式中以 wchar_t 和 wide char 系列函式處理 Unicode。
Unicode程式專案有 _UNICODE 定義。


來源:http://www.csie.nctu.edu.tw/~skyang/unicodestr.zhtw.htm

[轉貼] 萬國碼字串函式
Unicode 字元與字串

在 C/C++語言當中可以以前綴字 L 告知編譯器這是個 Unicode 字元或字串,於是編譯器便會將這些文字以 UTF-16 內碼存放。Unicode 字元的型別是 wchar_t,例如:

wchar_t ch = L'a';
就是宣告了一個 unicode 字元 ch 而且令它為字母 a,須注意的是 L'a' 不等於 'a',也不等於 97,因為 'a' 是 char 型別的字母 a,乃是以 ASCII 碼表示的,而字母 a 的 ASCII 碼是 97,所以 'a' 等於 97,然而 unicode 字元 L'a' 乃是以 UTF-16 內碼來表示字母 a,UTF-16 中的字母 a 不是 97,所以 L'a' 自然也不等於 'a'。

既然 unicode 字元是以 wchar_t 儲存的,unicode 字串自然也是以 wchar_t 陣列來存放,例如:

wchar_t myname[8] = L"SKY";
這個字串是個以 L'\0' 為結束字元的字串,不是 ASCII 的 '\0' 喔。

Unicode 字串函式

如前篇所述,unicode 字元及字串另有一套處理與輸出入函式,同樣是 #include ,例如字串處理函式有:

Unicode版本ASCII版本
區分大小寫的比較int wcscmp( const wchar_t *string1, const wchar_t *string2);int strcmp( const char *string1, const char *string2);
不分大小寫的比較int _wcsicmp( const wchar_t *string1, const wchar_t *string2);int _stricmp( const char *string1, const char *string2);
只比較前面n個字int wcsncmp( const wchar_t *string1, const wchar_t *string2, size_t count );int strncmp( const char *string1, const char *string2, size_t count );
複製字串wchar_t *wcscpy( wchar_t *strDestination, const wchar_t *strSrc );char *strcpy( char *strDestination, const char *strSrc );
算字串的長度size_t wcslen( const wchar_t *str);size_t strlen( const char *str);

在上面這個表的右邊是以前介紹過的ASCII字串處理函式,你可以看得出來 Unicode 版本的函式和 ASCII 版本的函式的差異,只有在左邊的 Unicode 版本都是以 wchar_t * 為輸入型別,右邊的 ASCII 本本是以 char * 為輸入型別,還有就是函式名稱如紅字所示,左邊都是 wcs (wide-char string)而右邊都是 str,除此之外使用法完全相同。

既然如此,可不可以這樣做:


#ifdef _UNICODE
    typedef TCHAR whcar_t;
    #define _T(x) L ## x
    #define _tcscpy wcscpy
    #define _tmain wmain
#else
    typedef TCHAR char;
    #define _T(x) x
    #define _tcscpy strcpy
    #define _tmain main
#endif
如此一來只要使用 TCHAR 型別、_T( ) 巨集、以及 tcs 系列的函式,這份程式碼在 unicode 程式當中便會自動地使用 wchar_t 型別及其相關的函式來處理 unicode 字串,而在非 unicode 的程式當中則會自動地以 char 型別及其相關函式來處理 ASCII 字串,所以這份程式碼可以是用於 unicode 專案以及非 unicode 專案,事實上,以上這段程式碼就是 tchar.h 的內容。

除了 #include 以外再多 #include ,你就有 TCHAR 型別、_T( ) 巨集、以及以下的函式可用:

TCHAR 版本
區分大小寫的比較int tcscmp( const TCHAR *string1, const TCHAR *string2);
不分大小寫的比較int _tcsicmp( const TCHAR  *string1, const TCHAR  *string2);
只比較前面n個字int tcsncmp( const TCHAR  *string1, const TCHAR  *string2, size_t count );
複製字串TCHAR  *tcscpy( TCHAR  *strDestination, const TCHAR  *strSrc );
算字串的長度size_t tcslen( const TCHAR  *str);

當你的專案中有 _UNICODE 定義的時候,以上的函式都會變成 wcs 版本,否則會變成 str 版本,例如這樣的原始程式碼:


TCHAR thename[8], myname[8] = _T("SKY");
tcscpy(thename, myname);
_tprintf(_T("%s\n"), thename);

當專案屬性是「使用 Unicode 字元集」的時候,它們會被解讀成:

wchar_t thename[8], myname[8] = L"SKY";
wcscpy(thename, myname);
wprintf(L"%s\n", thename);

否則當專案屬性是「使用多位元組字元集」的時候,它們會被解讀成:

char thename[8], myname[8] = _"SKY";
strcpy(thename, myname);
printf("%s\n", thename);

其中 wprintf( ) 和 _tprintf( ) 分別是 unicode 版本與 TCHAR 版本的字串輸出函式,除此之外,所有的字串處理與輸出入函式也都有 unicode 版本與 TCHAR 版本,包括先前介紹過的 atoi( ) 和 atof( ) 也有 _wtoi( ) 與 _wtof( ) 版本,strtok( ) 也有 wcstok( ) 版本,當然它們也都有 _ttoi( ) 與 _ttof( ) 以及 tcstok( ) 版本的函式。

Unicode 版本檔案函式

除了字串處理以外,文字檔案的處理函式也有 unicode 版本與 TCHAR 版本如下:

Unicode版本TCHAR版本
以 Unicode 字串檔名開啟檔案FILE *_wfopen(const wchar_t *filename, const wchar_t *mode);_tfopen( ) 
從檔案中讀取 Unicode 字串wchar_t *fgetws(wchar_t* string, int n, FILE* stream);fgetts( )
寫 Unicode 字串到檔案中iint fputws(const wchar_t *str, FILE *stream);_fputts( )

當然它們的是使用方法和 ASCII 版本得 fopen( )、fgets( )、以及 fputs( ) 完全相同,其中 _wfopen( ) 以 unicode 字串為檔名來開啟檔案自然沒有問題,但是文字檔案不是 ASCII 的嗎?(或者應該說是各國各自採用的內碼),那麼 fgetws( ) 從 ASCII 內碼的檔案讀入文字,讀入後變成 uncide 字串?而 fputws( ) 寫入 unicode 字串到 ASCII 檔案?

假設有個 a.txt 的內容是"你好" (ASCII字串),fgetws( ) 從 a.txt 能讀取到 L "你好" (Unicode 字串)?而 fputws( ) 寫入 L "你好" (Unicode 字串) 到 a.txt 變成 "你好" (ASCII字串) 嗎?為甚麼會有這種效果?其實就是字碼頁的作用,因為你的電腦採用 950 號字碼頁 (繁體中文):

fgetws( ): Windows 依字碼頁將讀入字串轉為 Unicode
fputws( ): Windows 依字碼頁將寫入字串轉為 ASCII
所以在 unicode 程式當中以這些函式去存取純文字檔案的時候,你不需要去關心這些內碼轉換方面的問題,Windows 已經暗中幫你做掉了,以下的 UniDumpFile 範例以 unicode 版本的函式去 dump 一個文字檔案,其實這是先前的 DumpTextFile 範例的 unicode 版本,除了逐行讀入以外,這個範例還利用空白逐字切割字串,以展示相關函式的使用:

#include <tchar.h>
#include <stdio.h>

void _tmain(void)
{
    TCHAR buffer[256];

    // 嘗試開啟ReadMe.txt 檔案:
    FILE * stream = _tfopen(_T("ReadMe.txt"), _T("rt"));
    TCHAR * token = NULL;

    if (stream)
    {
        // 如果檔案開啟成功,以 fgetws( ) 逐行讀取:
        while(_fgetts(buffer, 256, stream) != NULL)
        {
            token = _tcstok buffer, _T(" \r\n"));
            while (token != NULL)
            {
                _tprintf(_T("%s\n"), token);
                token = _tcstok(NULL, _T(" \r\n"));
            }
        }

        // 關閉檔案:
        fclose(stream);
    }
    else
    {   _tprintf( _T("檔案不存在喔! "));   }
}

這個程式的執行結果如下,你可以看到雖然 ReadMe.txt 是一個採用 Big-5 碼的繁體中文純文字檔案,它仍然可以被此 _fgetts( ) (也就是 fgetws( )) 正確地讀入為 unicode 字串,並且被 _tcstok( ) 正確地切割了。

這是一個
被Dump的
ASCII檔案.
Say
Hello
to
Unicode!

Unicode 程式設計摘要

專案屬性選擇「使用 Unicode 字元集」。
#include
用 _tmain 代替 main。
用 TCHAR 代替 char。
字串前後加上 _T( ),字元前後也加上 _T( )。
使用 tcsXXX 系列的字串函式取代 strXXX。
使用 _tXXX 系列的檔案字串函式,各字串函式的 TCHAR 版為何請查閱 MSDN。
本篇重點回顧

您知道了嗎?
所有的 ASCII 字串函式都有 Unicode 版本(str→wcs)。
#include 以後有 _T( ) 和 tcs 系列函式巨集。
以 Unicode 函式處理 ASCII 文字檔案時,Windows 會依照系統目前的字碼頁(code page)做內碼轉換。

後記:
原站似乎打不太開,先備份這篇好文章,如有問題請告知。

2013年3月28日 星期四

Visual Studio 路徑目錄巨集

巨集說明
$(ConfigurationName)目前專案組態的名稱 (例如「Debug」)。
$(PlatformName)目前專案平台的名稱 (例如「Win32」)。
$(OutDir)相對於專案目錄的輸出檔目錄路徑。這將解析為 [輸出目錄] 屬性的值。尾端會加上反斜線「\」。
$(DevEnvDir)Visual Studio .NET 的安裝目錄 (定義為磁碟機 + 路徑);尾端會加上反斜線「\」。
$(ProjectDir)專案的目錄 (定義為磁碟機 + 路徑);尾端會加上反斜線「\」。
$(ProjectPath)專案的絕對路徑名稱 (定義為磁碟機 + 路徑 + 主檔名 + 副檔名)。
$(ProjectName)專案的主檔名。
$(ProjectFileName)專案的檔名 (定義為主檔名 + 副檔名)。
$(ProjectExt)專案檔的副檔名。它會在副檔名前面加上「.」。
$(SolutionDir)方案的目錄 (定義為磁碟機 + 路徑);尾端會加上反斜線「\」。
$(SolutionPath)方案的絕對路徑名稱 (定義為磁碟機 + 路徑 + 主檔名 + 副檔名)。
$(SolutionName)方案的主檔名。
$(SolutionFileName)方案的檔名 (定義為主檔名 + 副檔名)。
$(SolutionExt)方案的副檔名。它會在副檔名前面加上「.」。
$(TargetDir)建置的主要輸出檔目錄 (定義為磁碟機 + 路徑)。尾端會加上反斜線「\」。
$(TargetPath)建置主要輸出檔的絕對路徑名稱 (定義為磁碟機 + 路徑 + 主檔名 + 副檔名)。
$(TargetName)建置主要輸出檔的主檔名。
$(TargetFileName)建置主要輸出檔的檔名 (定義為主檔名 + 副檔名)。
$(TargetExt)建置主要輸出檔的副檔名。它會在副檔名前面加上「.」。

資料來源:
http://msdn.microsoft.com/zh-tw/library/42x5kfw4(v=vs.100).aspx

2013年3月18日 星期一

2013年2月21日 星期四

Build Action 選項



常用的選項:
  • None - 檔案未包含在專案輸出群組中,而且在建置過程中不加以編譯。範例之一是包含文件的文字檔,例如讀我檔案。
  • Compile - 將檔案編譯到建置輸出。這個設定值是用於程式碼檔。
  • Content - 不編譯檔案,但會將其加入內容輸出群組。例如,這個設定值是 .htm 或其他類型 Web 檔的預設值。
  • Embedded Resource - 將檔案以 DLL 或可執行檔嵌入主要專案建置輸出。這個值通常用於資源檔。

例如編譯後需要複製圖片作為資源時的屬性設定:
  • Build Action: Content
  • Copy to Output Directory: Copy always

參考:
http://msdn.microsoft.com/zh-tw/library/0c6xyb66(v=vs.80).aspx

2013年1月16日 星期三

專利搜尋筆記



這陣子在做報告找資料的時候,在某篇文獻中有提到許許多多的專利資料,由於很久沒查專利的資料,把大學教的知識都給忘光光啦,現在趕緊做點筆記以免再次發生這樣的糗事...

專利的一些基礎知識,
完整的專利號碼『WO 2013/012345』分為兩個部分:
1. 國家名稱 -
如:美國專利(US)、世界專利(WO)、歐洲專利(EP)、德國專利(DE)和日本專利(JP)等。
2. 專利號 -
如:2013/012345

好用的搜索網站:
Google Patent - https://www.google.com/?tbm=pts
Espacenet Patent search - https://worldwide.espacenet.com/
WEBPAT - http://webpat.tw/

在搜尋文獻中的專利時會發現可能有專利號但是找不到專利,
這時候不要使用專利號『WO 2009/058656』去搜尋,改由名稱去搜尋,
如首圖專利名稱為『Intra-oral three-dimensional imaging system』,
就在Google Patent搜尋該關鍵字,就有可能找到US版本的專利,
尤其US版本的專利通常是可以在Google Patent下載的。

2013年1月5日 星期六

使用Apache架設Subversion + TortoiseSVN



系統配置:
Windows 7 X64 SP1
Apache Lounge 2.4.3 ssl 0.9.8
PHP 5.4

使用軟體:
svn-win32-1.7.8-ap24.zip (伺服端)
http://sourceforge.net/projects/win32svn/

TortoiseSVN-1.7.11.23600-x64-svn-1.7.8.msi (客戶端)
LanguagePack_1.7.11.23600-x64-zh_TW.msi (中文化)
http://sourceforge.net/projects/tortoisesvn/

在開始之前,請確定您的Apache已經架設完畢可正常運作。


首先安裝SVN伺服端:
1. 複製『svn-win32-1.7.8-ap24.zip』壓縮檔內的 bin/mod_dav_svn.so 與 bin/mod_authz_svn.so 至 Apache 的 modules 目錄下。

2. 在我的電腦 > 進階系統設定 > 進階 > 環境變數 > 系統變數 > 找到Path,
新增一筆變數值並以分號分隔『;D:\svn-win32-1.7.8\bin』

3. 編輯 Apache 設定檔(httpd.conf) 遵照以下指示變更:

3a. 取消註解以下內容:
#LoadModule dav_fs_module modules/mod_dav_fs.so
#LoadModule dav_module modules/mod_dav.so

3b.在LoadModule最後加上以下內容(有順序不可加在前):
LoadModule dav_svn_module modules/mod_dav_svn.so
LoadModule authz_svn_module modules/mod_authz_svn.so

3c. 在檔案最底加上以下內容:
<location svn="svn">
DAV svn
SVNPath D:/SVN
</location>

其中『/svn/code』是指要在『http://localhost/svn/code』作為主要的目錄,而『D:/SVN』是指在電腦內所指定要同步的絕對目錄。


安裝SVN客戶端,這裡使用『TortoiseSVN』作為客戶端應用程式。

1. 請依指示安裝『TortoiseSVN-1.7.11.23600-x64-svn-1.7.8.msi』以及『LanguagePack_1.7.11.23600-x64-zh_TW.msi』。

2. 在『D:/』建立一個『SVN』資料夾,在資料夾內按右鍵『建立檔案庫』。


3. 為方便整理,直接在SVN資料夾內新增一個專案資料夾『QQBoxy』,並按右鍵設定取出。


4. 將SVN檔案庫根目錄『http://您的IP或網域/svn』(依需求也可對應子目錄)對應到資料夾即完成同步設定。

若您的Server支援SSL模式,可直接將檔案庫根目錄改為https將具備更高的安全性。

5. 在資料夾按右鍵即可"更新"或"送交"新版資料。


結束。

2013年1月2日 星期三

演算法落實於軟體

The algorithms implemented in the software:
  • Preprocessing (前處理)
    • Blurring (模糊演算)
    • Frequency (頻譜分析)
    • Edge Detection (邊緣檢測)
    • Distortion Reduction (失真減少)
    • Morphological (型態)
    • Geometry (幾何)
  • Segmentation (分割)
    • Clustering (分群法)
      • Fuzzy K-means
      • Markov Random Field
    • Region Growing (區域成長)
    • Level Set (水平集法)
      • Laplacian
      • Canny
      • Threshold
      • Geodesic Active Contour
    • Thresholding (閾(ㄩˋ)值/臨界值)
  • Registration (定位)
    • Transformation (轉換)
      • Rigid (硬組織)
        • Translation
        • Scaling
        • Affine
        • Euler
        • Similarity
      • Non-Rigid (軟組織)
        • B-spline Deformable (B-spline變形)
    • Metric (量測)
      • Label Map (標籤地圖)
        • Match Cardinality
        • Kappa Statistics
      • Multi-Modality (多模態分析)
        • Mutual Information
        • Normalized Mutual Information
        • Gradient Difference
      • Single Modality (單模態分析)
        • Mean Square
        • Normalized Correlation
        • Mean Reciprocal Square
        • Difference
    • Optimizer (最佳化)
      • Gradient Based (梯度法)
        • Gradient Descent
        • Regular Step Gradient Descent
        • BFGS
      • Global Optimizers (全域最佳化)
        • Non-Probabilistic (非機率)
          • One Plus One Evolutionary
        • Probabilistic (機率)
          • SPSA
          • Powell
          • Amoeba
    • Interpolator (插補器)
      • Nearest Neighborhood
      • Linear
      • Bsline (order 2-5)

此為醫學領域在軟體上常用的演算法。
參考文獻來源:
Web-based interactive 2D/3D medical image processing and visualization software