Merge to XFA: Use stdint.h types throughout PDFium.
[pdfium.git] / xfa / src / fxbarcode / datamatrix / BC_HighLevelEncoder.cpp
1 // Copyright 2014 PDFium Authors. All rights reserved.\r
2 // Use of this source code is governed by a BSD-style license that can be\r
3 // found in the LICENSE file.\r
4 \r
5 // Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com\r
6 // Original code is licensed as follows:\r
7 /*\r
8  * Copyright 2006-2007 Jeremias Maerki.\r
9  *\r
10  * Licensed under the Apache License, Version 2.0 (the "License");\r
11  * you may not use this file except in compliance with the License.\r
12  * You may obtain a copy of the License at\r
13  *\r
14  *      http://www.apache.org/licenses/LICENSE-2.0\r
15  *\r
16  * Unless required by applicable law or agreed to in writing, software\r
17  * distributed under the License is distributed on an "AS IS" BASIS,\r
18  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\r
19  * See the License for the specific language governing permissions and\r
20  * limitations under the License.\r
21  */\r
22 \r
23 #include "../barcode.h"\r
24 #include "../BC_Dimension.h"\r
25 #include "../BC_UtilCodingConvert.h"\r
26 #include "../common/BC_CommonBitMatrix.h"\r
27 #include "BC_Encoder.h"\r
28 #include "BC_SymbolShapeHint.h"\r
29 #include "BC_SymbolInfo.h"\r
30 #include "BC_EncoderContext.h"\r
31 #include "BC_C40Encoder.h"\r
32 #include "BC_TextEncoder.h"\r
33 #include "BC_X12Encoder.h"\r
34 #include "BC_EdifactEncoder.h"\r
35 #include "BC_Base256Encoder.h"\r
36 #include "BC_ASCIIEncoder.h"\r
37 #include "BC_HighLevelEncoder.h"\r
38 #define  Integer_MAX_VALUE   2147483647\r
39 FX_WCHAR CBC_HighLevelEncoder::LATCH_TO_C40 = 230;\r
40 FX_WCHAR CBC_HighLevelEncoder::LATCH_TO_BASE256 = 231;\r
41 FX_WCHAR CBC_HighLevelEncoder::UPPER_SHIFT = 235;\r
42 FX_WCHAR CBC_HighLevelEncoder::LATCH_TO_ANSIX12 = 238;\r
43 FX_WCHAR CBC_HighLevelEncoder::LATCH_TO_TEXT = 239;\r
44 FX_WCHAR CBC_HighLevelEncoder::LATCH_TO_EDIFACT = 240;\r
45 FX_WCHAR CBC_HighLevelEncoder::C40_UNLATCH = 254;\r
46 FX_WCHAR CBC_HighLevelEncoder::X12_UNLATCH = 254;\r
47 FX_WCHAR CBC_HighLevelEncoder::PAD = 129;\r
48 FX_WCHAR CBC_HighLevelEncoder::MACRO_05 = 236;\r
49 FX_WCHAR CBC_HighLevelEncoder::MACRO_06 = 237;\r
50 const wchar_t* CBC_HighLevelEncoder::MACRO_05_HEADER = L"[)>\1e05";\r
51 const wchar_t* CBC_HighLevelEncoder::MACRO_06_HEADER = L"[)>\1e06";\r
52 const wchar_t CBC_HighLevelEncoder::MACRO_TRAILER = 0x0004;\r
53 CBC_HighLevelEncoder::CBC_HighLevelEncoder()\r
54 {\r
55 }\r
56 CBC_HighLevelEncoder::~CBC_HighLevelEncoder()\r
57 {\r
58 }\r
59 CFX_ByteArray& CBC_HighLevelEncoder::getBytesForMessage(CFX_WideString msg)\r
60 {\r
61     CFX_ByteString bytestr;\r
62     CBC_UtilCodingConvert::UnicodeToUTF8(msg, bytestr);\r
63     for (int32_t i = 0; i < bytestr.GetLength(); i++) {\r
64         m_bytearray.Add(bytestr.GetAt(i));\r
65     }\r
66     return m_bytearray;\r
67 }\r
68 CFX_WideString CBC_HighLevelEncoder::encodeHighLevel(CFX_WideString msg, CFX_WideString ecLevel, int32_t &e)\r
69 {\r
70     return encodeHighLevel(msg, ecLevel, FORCE_NONE, NULL, NULL, e);\r
71 }\r
72 CFX_WideString CBC_HighLevelEncoder::encodeHighLevel(CFX_WideString msg,  CFX_WideString ecLevel, SymbolShapeHint shape, CBC_Dimension* minSize, CBC_Dimension* maxSize, int32_t &e)\r
73 {\r
74     CBC_EncoderContext context(msg, ecLevel, e);\r
75     BC_EXCEPTION_CHECK_ReturnValue(e, (FX_LPWSTR)"");\r
76     context.setSymbolShape(shape);\r
77     context.setSizeConstraints(minSize, maxSize);\r
78     if ((msg.Mid(0, 6) == MACRO_05_HEADER) && (msg.Mid(msg.GetLength() - 1, 1) == MACRO_TRAILER)) {\r
79         context.writeCodeword(MACRO_05);\r
80         context.setSkipAtEnd(2);\r
81         context.m_pos += 6;\r
82     } else if ((msg.Mid(0, 6) == MACRO_06_HEADER) && (msg.Mid(msg.GetLength() - 1, 1) == MACRO_TRAILER)) {\r
83         context.writeCodeword(MACRO_06);\r
84         context.setSkipAtEnd(2);\r
85         context.m_pos += 6;\r
86     }\r
87     CFX_PtrArray encoders;\r
88     encoders.Add(FX_NEW CBC_ASCIIEncoder());\r
89     encoders.Add(FX_NEW CBC_C40Encoder());\r
90     encoders.Add(FX_NEW CBC_TextEncoder());\r
91     encoders.Add(FX_NEW CBC_X12Encoder());\r
92     encoders.Add(FX_NEW CBC_EdifactEncoder());\r
93     encoders.Add(FX_NEW CBC_Base256Encoder());\r
94     int32_t encodingMode = ASCII_ENCODATION;\r
95     while (context.hasMoreCharacters()) {\r
96         ((CBC_Encoder*)encoders.GetAt(encodingMode))->Encode(context, e);\r
97         if (e != BCExceptionNO) {\r
98             for (int32_t i = 0; i < encoders.GetSize(); i++) {\r
99                 delete (CBC_Encoder*)encoders.GetAt(i);\r
100             }\r
101             encoders.RemoveAll();\r
102             return (FX_LPWSTR)"";\r
103         }\r
104         if (context.m_newEncoding >= 0) {\r
105             encodingMode = context.m_newEncoding;\r
106             context.resetEncoderSignal();\r
107         }\r
108     }\r
109     int32_t len = context.m_codewords.GetLength();\r
110     context.updateSymbolInfo(e);\r
111     if (e != BCExceptionNO) {\r
112         for (int32_t i = 0; i < encoders.GetSize(); i++) {\r
113             delete (CBC_Encoder*)encoders.GetAt(i);\r
114         }\r
115         encoders.RemoveAll();\r
116         return (FX_LPWSTR)"";\r
117     }\r
118     int32_t capacity = context.m_symbolInfo->m_dataCapacity;\r
119     if (len < capacity) {\r
120         if (encodingMode != ASCII_ENCODATION && encodingMode != BASE256_ENCODATION) {\r
121             context.writeCodeword(0x00fe);\r
122         }\r
123     }\r
124     CFX_WideString codewords = context.m_codewords;\r
125     if (codewords.GetLength() < capacity) {\r
126         codewords += PAD;\r
127     }\r
128     while (codewords.GetLength() < capacity) {\r
129         codewords += (randomize253State(PAD, codewords.GetLength() + 1));\r
130     }\r
131     for (int32_t i = 0; i < encoders.GetSize(); i++) {\r
132         delete (CBC_Encoder*)encoders.GetAt(i);\r
133     }\r
134     encoders.RemoveAll();\r
135     return codewords;\r
136 }\r
137 int32_t CBC_HighLevelEncoder::lookAheadTest(CFX_WideString msg, int32_t startpos, int32_t currentMode)\r
138 {\r
139     if (startpos >= msg.GetLength()) {\r
140         return currentMode;\r
141     }\r
142     CFX_FloatArray charCounts;\r
143     if (currentMode == ASCII_ENCODATION) {\r
144         charCounts.Add(0);\r
145         charCounts.Add(1);\r
146         charCounts.Add(1);\r
147         charCounts.Add(1);\r
148         charCounts.Add(1);\r
149         charCounts.Add(1.25f);\r
150     } else {\r
151         charCounts.Add(1);\r
152         charCounts.Add(2);\r
153         charCounts.Add(2);\r
154         charCounts.Add(2);\r
155         charCounts.Add(2);\r
156         charCounts.Add(2.25f);\r
157         charCounts[currentMode] = 0;\r
158     }\r
159     int32_t charsProcessed = 0;\r
160     while (TRUE) {\r
161         if ((startpos + charsProcessed) == msg.GetLength()) {\r
162             FX_DWORD min = Integer_MAX_VALUE;\r
163             CFX_ByteArray mins;\r
164             mins.SetSize(6);\r
165             CFX_Int32Array intCharCounts;\r
166             intCharCounts.SetSize(6);\r
167             min = findMinimums(charCounts, intCharCounts, min, mins);\r
168             int32_t minCount = getMinimumCount(mins);\r
169             if (intCharCounts[ASCII_ENCODATION] == min) {\r
170                 return ASCII_ENCODATION;\r
171             }\r
172             if (minCount == 1 && mins[BASE256_ENCODATION] > 0) {\r
173                 return BASE256_ENCODATION;\r
174             }\r
175             if (minCount == 1 && mins[EDIFACT_ENCODATION] > 0) {\r
176                 return EDIFACT_ENCODATION;\r
177             }\r
178             if (minCount == 1 && mins[TEXT_ENCODATION] > 0) {\r
179                 return TEXT_ENCODATION;\r
180             }\r
181             if (minCount == 1 && mins[X12_ENCODATION] > 0) {\r
182                 return X12_ENCODATION;\r
183             }\r
184             return C40_ENCODATION;\r
185         }\r
186         FX_WCHAR c = msg.GetAt(startpos + charsProcessed);\r
187         charsProcessed++;\r
188         if (isDigit(c)) {\r
189             charCounts[ASCII_ENCODATION] += 0.5;\r
190         } else if (isExtendedASCII(c)) {\r
191             charCounts[ASCII_ENCODATION] = (FX_FLOAT) ceil(charCounts[ASCII_ENCODATION]);\r
192             charCounts[ASCII_ENCODATION] += 2;\r
193         } else {\r
194             charCounts[ASCII_ENCODATION] = (FX_FLOAT) ceil(charCounts[ASCII_ENCODATION]);\r
195             charCounts[ASCII_ENCODATION]++;\r
196         }\r
197         if (isNativeC40(c)) {\r
198             charCounts[C40_ENCODATION] += 2.0f / 3.0f;\r
199         } else if (isExtendedASCII(c)) {\r
200             charCounts[C40_ENCODATION] += 8.0f / 3.0f;\r
201         } else {\r
202             charCounts[C40_ENCODATION] += 4.0f / 3.0f;\r
203         }\r
204         if (isNativeText(c)) {\r
205             charCounts[TEXT_ENCODATION] += 2.0f / 3.0f;\r
206         } else if (isExtendedASCII(c)) {\r
207             charCounts[TEXT_ENCODATION] += 8.0f / 3.0f;\r
208         } else {\r
209             charCounts[TEXT_ENCODATION] += 4.0f / 3.0f;\r
210         }\r
211         if (isNativeX12(c)) {\r
212             charCounts[X12_ENCODATION] += 2.0f / 3.0f;\r
213         } else if (isExtendedASCII(c)) {\r
214             charCounts[X12_ENCODATION] += 13.0f / 3.0f;\r
215         } else {\r
216             charCounts[X12_ENCODATION] += 10.0f / 3.0f;\r
217         }\r
218         if (isNativeEDIFACT(c)) {\r
219             charCounts[EDIFACT_ENCODATION] += 3.0f / 4.0f;\r
220         } else if (isExtendedASCII(c)) {\r
221             charCounts[EDIFACT_ENCODATION] += 17.0f / 4.0f;\r
222         } else {\r
223             charCounts[EDIFACT_ENCODATION] += 13.0f / 4.0f;\r
224         }\r
225         if (isSpecialB256(c)) {\r
226             charCounts[BASE256_ENCODATION] += 4;\r
227         } else {\r
228             charCounts[BASE256_ENCODATION]++;\r
229         }\r
230         if (charsProcessed >= 4) {\r
231             CFX_Int32Array intCharCounts;\r
232             intCharCounts.SetSize(6);\r
233             CFX_ByteArray mins;\r
234             mins.SetSize(6);\r
235             findMinimums(charCounts, intCharCounts, Integer_MAX_VALUE, mins);\r
236             int32_t minCount = getMinimumCount(mins);\r
237             if (intCharCounts[ASCII_ENCODATION] < intCharCounts[BASE256_ENCODATION]\r
238                     && intCharCounts[ASCII_ENCODATION] < intCharCounts[C40_ENCODATION]\r
239                     && intCharCounts[ASCII_ENCODATION] < intCharCounts[TEXT_ENCODATION]\r
240                     && intCharCounts[ASCII_ENCODATION] < intCharCounts[X12_ENCODATION]\r
241                     && intCharCounts[ASCII_ENCODATION] < intCharCounts[EDIFACT_ENCODATION]) {\r
242                 return ASCII_ENCODATION;\r
243             }\r
244             if (intCharCounts[BASE256_ENCODATION] < intCharCounts[ASCII_ENCODATION]\r
245                     || (mins[C40_ENCODATION] + mins[TEXT_ENCODATION] + mins[X12_ENCODATION] + mins[EDIFACT_ENCODATION]) == 0) {\r
246                 return BASE256_ENCODATION;\r
247             }\r
248             if (minCount == 1 && mins[EDIFACT_ENCODATION] > 0) {\r
249                 return EDIFACT_ENCODATION;\r
250             }\r
251             if (minCount == 1 && mins[TEXT_ENCODATION] > 0) {\r
252                 return TEXT_ENCODATION;\r
253             }\r
254             if (minCount == 1 && mins[X12_ENCODATION] > 0) {\r
255                 return X12_ENCODATION;\r
256             }\r
257             if (intCharCounts[C40_ENCODATION] + 1 < intCharCounts[ASCII_ENCODATION]\r
258                     && intCharCounts[C40_ENCODATION] + 1 < intCharCounts[BASE256_ENCODATION]\r
259                     && intCharCounts[C40_ENCODATION] + 1 < intCharCounts[EDIFACT_ENCODATION]\r
260                     && intCharCounts[C40_ENCODATION] + 1 < intCharCounts[TEXT_ENCODATION]) {\r
261                 if (intCharCounts[C40_ENCODATION] < intCharCounts[X12_ENCODATION]) {\r
262                     return C40_ENCODATION;\r
263                 }\r
264                 if (intCharCounts[C40_ENCODATION] == intCharCounts[X12_ENCODATION]) {\r
265                     int32_t p = startpos + charsProcessed + 1;\r
266                     while (p < msg.GetLength()) {\r
267                         FX_WCHAR tc = msg.GetAt(p);\r
268                         if (isX12TermSep(tc)) {\r
269                             return X12_ENCODATION;\r
270                         }\r
271                         if (!isNativeX12(tc)) {\r
272                             break;\r
273                         }\r
274                         p++;\r
275                     }\r
276                     return C40_ENCODATION;\r
277                 }\r
278             }\r
279         }\r
280     }\r
281 }\r
282 FX_BOOL CBC_HighLevelEncoder::isDigit(FX_WCHAR ch)\r
283 {\r
284     return ch >= '0' && ch <= '9';\r
285 }\r
286 FX_BOOL CBC_HighLevelEncoder::isExtendedASCII(FX_WCHAR ch)\r
287 {\r
288     return ch >= 128 && ch <= 255;\r
289 }\r
290 int32_t CBC_HighLevelEncoder::determineConsecutiveDigitCount(CFX_WideString msg, int32_t startpos)\r
291 {\r
292     int32_t count = 0;\r
293     int32_t len = msg.GetLength();\r
294     int32_t idx = startpos;\r
295     if (idx < len) {\r
296         FX_WCHAR ch = msg.GetAt(idx);\r
297         while (isDigit(ch) && idx < len) {\r
298             count++;\r
299             idx++;\r
300             if (idx < len) {\r
301                 ch = msg.GetAt(idx);\r
302             }\r
303         }\r
304     }\r
305     return count;\r
306 }\r
307 void CBC_HighLevelEncoder::illegalCharacter(FX_WCHAR c, int32_t &e)\r
308 {\r
309     e = BCExceptionIllegalArgument;\r
310 }\r
311 FX_WCHAR CBC_HighLevelEncoder::randomize253State(FX_WCHAR ch, int32_t codewordPosition)\r
312 {\r
313     int32_t pseudoRandom = ((149 * codewordPosition) % 253) + 1;\r
314     int32_t tempVariable = ch + pseudoRandom;\r
315     return tempVariable <= 254 ? (FX_WCHAR) tempVariable : (FX_WCHAR) (tempVariable - 254);\r
316 }\r
317 int32_t CBC_HighLevelEncoder::findMinimums(CFX_FloatArray &charCounts, CFX_Int32Array &intCharCounts, int32_t min, CFX_ByteArray &mins)\r
318 {\r
319     for (int32_t l = 0; l < mins.GetSize(); l++) {\r
320         mins[l] = (uint8_t)0;\r
321     }\r
322     for (int32_t i = 0; i < 6; i++) {\r
323         intCharCounts[i] = (int32_t)ceil(charCounts[i]);\r
324         int32_t current = intCharCounts[i];\r
325         if (min > current) {\r
326             min = current;\r
327             for (int32_t j = 0; j < mins.GetSize(); j++) {\r
328                 mins[j] = (uint8_t)0;\r
329             }\r
330         }\r
331         if (min == current) {\r
332             mins[i]++;\r
333         }\r
334     }\r
335     return min;\r
336 }\r
337 int32_t CBC_HighLevelEncoder::getMinimumCount(CFX_ByteArray &mins)\r
338 {\r
339     int32_t minCount = 0;\r
340     for (int32_t i = 0; i < 6; i++) {\r
341         minCount += mins[i];\r
342     }\r
343     return minCount;\r
344 }\r
345 FX_BOOL CBC_HighLevelEncoder::isNativeC40(FX_WCHAR ch)\r
346 {\r
347     return (ch == ' ') || (ch >= '0' && ch <= '9') || (ch >= 'A' && ch <= 'Z');\r
348 }\r
349 FX_BOOL CBC_HighLevelEncoder::isNativeText(FX_WCHAR ch)\r
350 {\r
351     return (ch == ' ') || (ch >= '0' && ch <= '9') || (ch >= 'a' && ch <= 'z');\r
352 }\r
353 FX_BOOL CBC_HighLevelEncoder::isNativeX12(FX_WCHAR ch)\r
354 {\r
355     return isX12TermSep(ch) || (ch == ' ') || (ch >= '0' && ch <= '9') || (ch >= 'A' && ch <= 'Z');\r
356 }\r
357 FX_BOOL CBC_HighLevelEncoder::isX12TermSep(FX_WCHAR ch)\r
358 {\r
359     return (ch == '\r') || (ch == '*') || (ch == '>');\r
360 }\r
361 FX_BOOL CBC_HighLevelEncoder::isNativeEDIFACT(FX_WCHAR ch)\r
362 {\r
363     return ch >= ' ' && ch <= '^';\r
364 }\r
365 FX_BOOL CBC_HighLevelEncoder::isSpecialB256(FX_WCHAR ch)\r
366 {\r
367     return FALSE;\r
368 }\r