Initial commit.
[pdfium.git] / core / src / fpdftext / unicodenormalization.cpp
1 // Copyright 2014 PDFium Authors. All rights reserved.\r
2 // Use of this source code is governed by a BSD-style license that can be\r
3 // found in the LICENSE file.\r
4  \r
5 // Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com\r
6 \r
7 #include "../../include/fpdftext/fpdf_text.h"\r
8 extern const FX_WCHAR g_UnicodeData_Normalization[65536];\r
9 extern const FX_WCHAR g_UnicodeData_Normalization_Map1[5376];\r
10 extern const FX_WCHAR g_UnicodeData_Normalization_Map2[1734];\r
11 extern const FX_WCHAR g_UnicodeData_Normalization_Map3[1164];\r
12 extern const FX_WCHAR g_UnicodeData_Normalization_Map4[488];\r
13 FX_LPCWSTR g_UnicodeData_Normalization_Maps[5] = {\r
14     NULL,\r
15     g_UnicodeData_Normalization_Map1,\r
16     g_UnicodeData_Normalization_Map2,\r
17     g_UnicodeData_Normalization_Map3,\r
18     g_UnicodeData_Normalization_Map4\r
19 };\r
20 FX_STRSIZE FX_Unicode_GetNormalization(FX_WCHAR wch, FX_LPWSTR pDst)\r
21 {\r
22     wch = wch & 0xFFFF;\r
23     FX_WCHAR wFind = g_UnicodeData_Normalization[wch];\r
24     if (!wFind) {\r
25         if (pDst) {\r
26             *pDst = wch;\r
27         }\r
28         return 1;\r
29     }\r
30     if(wFind >= 0x8000) {\r
31         wch = wFind - 0x8000;\r
32         wFind = 1;\r
33     } else {\r
34         wch = wFind & 0x0FFF;\r
35         wFind >>= 12;\r
36     }\r
37     FX_LPCWSTR pMap = g_UnicodeData_Normalization_Maps[wFind];\r
38     if (pMap == g_UnicodeData_Normalization_Map4) {\r
39         pMap = g_UnicodeData_Normalization_Map4 + wch;\r
40         wFind = (FX_WCHAR)(*pMap ++);\r
41     } else {\r
42         pMap += wch;\r
43     }\r
44     if (pDst) {\r
45         FX_WCHAR n = wFind;\r
46         while (n --) {\r
47             *pDst ++ = *pMap ++;\r
48         }\r
49     }\r
50     return (FX_STRSIZE)wFind;\r
51 }\r
52 FX_STRSIZE FX_WideString_GetNormalization(FX_WSTR wsSrc, FX_LPWSTR pDst)\r
53 {\r
54     FX_STRSIZE nCount = 0;\r
55     for (FX_STRSIZE len = 0; len < wsSrc.GetLength(); len ++) {\r
56         FX_WCHAR wch = wsSrc.GetAt(len);\r
57         if(pDst) {\r
58             nCount += FX_Unicode_GetNormalization(wch, pDst + nCount);\r
59         } else {\r
60             nCount += FX_Unicode_GetNormalization(wch, pDst);\r
61         }\r
62     }\r
63     return nCount;\r
64 }\r
65 FX_STRSIZE FX_WideString_GetNormalization(FX_WSTR wsSrc, CFX_WideString &wsDst)\r
66 {\r
67     FX_STRSIZE nLen = FX_WideString_GetNormalization(wsSrc, (FX_LPWSTR)NULL);\r
68     if (!nLen) {\r
69         return 0;\r
70     }\r
71     FX_LPWSTR pBuf = wsDst.GetBuffer(nLen);\r
72     FX_WideString_GetNormalization(wsSrc, pBuf);\r
73     wsDst.ReleaseBuffer(nLen);\r
74     return nLen;\r
75 }\r