Merge to XFA: Kill CFX_Object.
[pdfium.git] / core / src / fpdfapi / fpdf_parser / fpdf_parser_parser.cpp
1 // Copyright 2014 PDFium Authors. All rights reserved.
2 // Use of this source code is governed by a BSD-style license that can be
3 // found in the LICENSE file.
4  
5 // Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com
6
7 #include "../../../include/fpdfapi/fpdf_parser.h"
8 #include "../../../include/fpdfapi/fpdf_module.h"
9 #include "../../../include/fpdfapi/fpdf_page.h"
10 #include "../../../src/fxcrt/fx_safe_types.h"
11 #include "../fpdf_page/pageint.h"
12 #include <utility>
13 #include <vector>
14
15 FX_BOOL IsSignatureDict(const CPDF_Dictionary* pDict)
16 {
17     CPDF_Object* pType = pDict->GetElementValue(FX_BSTRC("Type"));
18     if (!pType) {
19         pType = pDict->GetElementValue(FX_BSTRC("FT"));
20         if (!pType) {
21             return FALSE;
22         }
23     }
24     if (pType->GetString() == FX_BSTRC("Sig")) {
25         return TRUE;
26     }
27     return FALSE;
28 }
29 static FX_INT32 _CompareDWord(const void* p1, const void* p2)
30 {
31     return (*(FX_DWORD*)p1) - (*(FX_DWORD*)p2);
32 }
33 static int _CompareFileSize(const void* p1, const void* p2)
34 {
35     FX_FILESIZE ret = (*(FX_FILESIZE*)p1) - (*(FX_FILESIZE*)p2);
36     if (ret > 0) {
37         return 1;
38     }
39     if (ret < 0) {
40         return -1;
41     }
42     return 0;
43 }
44
45 CPDF_Parser::CPDF_Parser()
46 {
47     m_pDocument = NULL;
48     m_pTrailer = NULL;
49     m_pEncryptDict = NULL;
50     m_pSecurityHandler = NULL;
51     m_pLinearized = NULL;
52     m_dwFirstPageNo = 0;
53     m_dwXrefStartObjNum = 0;
54     m_bOwnFileRead = TRUE;
55     m_FileVersion = 0;
56     m_bForceUseSecurityHandler = FALSE;
57 }
58 CPDF_Parser::~CPDF_Parser()
59 {
60     CloseParser(FALSE);
61 }
62 FX_DWORD CPDF_Parser::GetLastObjNum()
63 {
64     FX_DWORD dwSize = m_CrossRef.GetSize();
65     return dwSize ? dwSize - 1 : 0;
66 }
67 void CPDF_Parser::SetEncryptDictionary(CPDF_Dictionary* pDict)
68 {
69     m_pEncryptDict = pDict;
70 }
71 void CPDF_Parser::CloseParser(FX_BOOL bReParse)
72 {
73     m_bVersionUpdated = FALSE;
74     if (m_pDocument && !bReParse) {
75         delete m_pDocument;
76         m_pDocument = NULL;
77     }
78     if (m_pTrailer) {
79         m_pTrailer->Release();
80         m_pTrailer = NULL;
81     }
82     ReleaseEncryptHandler();
83     SetEncryptDictionary(NULL);
84     if (m_bOwnFileRead && m_Syntax.m_pFileAccess) {
85         m_Syntax.m_pFileAccess->Release();
86         m_Syntax.m_pFileAccess = NULL;
87     }
88     FX_POSITION pos = m_ObjectStreamMap.GetStartPosition();
89     while (pos) {
90         FX_LPVOID objnum;
91         CPDF_StreamAcc* pStream;
92         m_ObjectStreamMap.GetNextAssoc(pos, objnum, (void*&)pStream);
93         delete pStream;
94     }
95     m_ObjectStreamMap.RemoveAll();
96     m_SortedOffset.RemoveAll();
97     m_CrossRef.RemoveAll();
98     m_V5Type.RemoveAll();
99     m_ObjVersion.RemoveAll();
100     FX_INT32 iLen = m_Trailers.GetSize();
101     for (FX_INT32 i = 0; i < iLen; ++i) {
102         if (CPDF_Dictionary* trailer = m_Trailers.GetAt(i))
103             trailer->Release();
104     }
105     m_Trailers.RemoveAll();
106     if (m_pLinearized) {
107         m_pLinearized->Release();
108         m_pLinearized = NULL;
109     }
110 }
111 static FX_INT32 GetHeaderOffset(IFX_FileRead* pFile)
112 {
113     FX_DWORD tag = FXDWORD_FROM_LSBFIRST(0x46445025);
114     FX_BYTE buf[4];
115     FX_INT32 offset = 0;
116     while (1) {
117         if (!pFile->ReadBlock(buf, offset, 4)) {
118             return -1;
119         }
120         if (*(FX_DWORD*)buf == tag) {
121             return offset;
122         }
123         offset ++;
124         if (offset > 1024) {
125             return -1;
126         }
127     }
128     return -1;
129 }
130 FX_DWORD CPDF_Parser::StartParse(FX_LPCSTR filename, FX_BOOL bReParse)
131 {
132     IFX_FileRead* pFileAccess = FX_CreateFileRead(filename);
133     if (!pFileAccess) {
134         return PDFPARSE_ERROR_FILE;
135     }
136     return StartParse(pFileAccess, bReParse);
137 }
138 FX_DWORD CPDF_Parser::StartParse(FX_LPCWSTR filename, FX_BOOL bReParse)
139 {
140     IFX_FileRead* pFileAccess = FX_CreateFileRead(filename);
141     if (!pFileAccess) {
142         return PDFPARSE_ERROR_FILE;
143     }
144     return StartParse(pFileAccess, bReParse);
145 }
146 CPDF_SecurityHandler* FPDF_CreateStandardSecurityHandler();
147 CPDF_SecurityHandler* FPDF_CreatePubKeyHandler(void*);
148 FX_DWORD CPDF_Parser::StartParse(IFX_FileRead* pFileAccess, FX_BOOL bReParse, FX_BOOL bOwnFileRead)
149 {
150     CloseParser(bReParse);
151     m_bXRefStream = FALSE;
152     m_LastXRefOffset = 0;
153     m_bOwnFileRead = bOwnFileRead;
154     FX_INT32 offset = GetHeaderOffset(pFileAccess);
155     if (offset == -1) {
156         if (bOwnFileRead && pFileAccess) {
157             pFileAccess->Release();
158         }
159         return PDFPARSE_ERROR_FORMAT;
160     }
161     m_Syntax.InitParser(pFileAccess, offset);
162     FX_BYTE ch;
163     if (!m_Syntax.GetCharAt(5, ch)) {
164         return PDFPARSE_ERROR_FORMAT;
165     }
166     if (ch >= '0' && ch <= '9') {
167         m_FileVersion = (ch - '0') * 10;
168     }
169     if (!m_Syntax.GetCharAt(7, ch)) {
170         return PDFPARSE_ERROR_FORMAT;
171     }
172     if (ch >= '0' && ch <= '9') {
173         m_FileVersion += ch - '0';
174     }
175     if (m_Syntax.m_FileLen <  m_Syntax.m_HeaderOffset + 9) {
176         return PDFPARSE_ERROR_FORMAT;
177     }
178     m_Syntax.RestorePos(m_Syntax.m_FileLen - m_Syntax.m_HeaderOffset - 9);
179     if (!bReParse) {
180         m_pDocument = FX_NEW CPDF_Document(this);
181     }
182     FX_BOOL bXRefRebuilt = FALSE;
183     if (m_Syntax.SearchWord(FX_BSTRC("startxref"), TRUE, FALSE, 4096)) {
184         FX_FILESIZE startxref_offset = m_Syntax.SavePos();
185         FX_LPVOID pResult = FXSYS_bsearch(&startxref_offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
186         if (pResult == NULL) {
187             m_SortedOffset.Add(startxref_offset);
188         }
189         m_Syntax.GetKeyword();
190         FX_BOOL bNumber;
191         CFX_ByteString xrefpos_str = m_Syntax.GetNextWord(bNumber);
192         if (!bNumber) {
193             return PDFPARSE_ERROR_FORMAT;
194         }
195         m_LastXRefOffset = (FX_FILESIZE)FXSYS_atoi64(xrefpos_str);
196         if (!LoadAllCrossRefV4(m_LastXRefOffset) && !LoadAllCrossRefV5(m_LastXRefOffset)) {
197             if (!RebuildCrossRef()) {
198                 return PDFPARSE_ERROR_FORMAT;
199             }
200             bXRefRebuilt = TRUE;
201             m_LastXRefOffset = 0;
202         }
203     } else {
204         if (!RebuildCrossRef()) {
205             return PDFPARSE_ERROR_FORMAT;
206         }
207         bXRefRebuilt = TRUE;
208     }
209     FX_DWORD dwRet = SetEncryptHandler();
210     if (dwRet != PDFPARSE_ERROR_SUCCESS) {
211         return dwRet;
212     }
213     m_pDocument->LoadDoc();
214     if (m_pDocument->GetRoot() == NULL || m_pDocument->GetPageCount() == 0) {
215         if (bXRefRebuilt) {
216             return PDFPARSE_ERROR_FORMAT;
217         }
218         ReleaseEncryptHandler();
219         if (!RebuildCrossRef()) {
220             return PDFPARSE_ERROR_FORMAT;
221         }
222         dwRet = SetEncryptHandler();
223         if (dwRet != PDFPARSE_ERROR_SUCCESS) {
224             return dwRet;
225         }
226         m_pDocument->LoadDoc();
227         if (m_pDocument->GetRoot() == NULL) {
228             return PDFPARSE_ERROR_FORMAT;
229         }
230     }
231     FXSYS_qsort(m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
232     FX_DWORD RootObjNum = GetRootObjNum();
233     if (RootObjNum == 0) {
234         ReleaseEncryptHandler();
235         RebuildCrossRef();
236         RootObjNum = GetRootObjNum();
237         if (RootObjNum == 0) {
238             return PDFPARSE_ERROR_FORMAT;
239         }
240         dwRet = SetEncryptHandler();
241         if (dwRet != PDFPARSE_ERROR_SUCCESS) {
242             return dwRet;
243         }
244     }
245     if (m_pSecurityHandler && !m_pSecurityHandler->IsMetadataEncrypted()) {
246         CPDF_Reference* pMetadata = (CPDF_Reference*)m_pDocument->GetRoot()->GetElement(FX_BSTRC("Metadata"));
247         if (pMetadata && pMetadata->GetType() == PDFOBJ_REFERENCE) {
248             m_Syntax.m_MetadataObjnum = pMetadata->GetRefObjNum();
249         }
250     }
251     return PDFPARSE_ERROR_SUCCESS;
252 }
253 FX_DWORD CPDF_Parser::SetEncryptHandler()
254 {
255     ReleaseEncryptHandler();
256     SetEncryptDictionary(NULL);
257     if (m_pTrailer == NULL) {
258         return PDFPARSE_ERROR_FORMAT;
259     }
260     CPDF_Object* pEncryptObj = m_pTrailer->GetElement(FX_BSTRC("Encrypt"));
261     if (pEncryptObj) {
262         if (pEncryptObj->GetType() == PDFOBJ_DICTIONARY) {
263             SetEncryptDictionary((CPDF_Dictionary*)pEncryptObj);
264         } else if (pEncryptObj->GetType() == PDFOBJ_REFERENCE) {
265             pEncryptObj = m_pDocument->GetIndirectObject(((CPDF_Reference*)pEncryptObj)->GetRefObjNum());
266             if (pEncryptObj) {
267                 SetEncryptDictionary(pEncryptObj->GetDict());
268             }
269         }
270     }
271     if (m_bForceUseSecurityHandler) {
272         FX_DWORD err = PDFPARSE_ERROR_HANDLER;
273         if (m_pSecurityHandler == NULL) {
274             return PDFPARSE_ERROR_HANDLER;
275         }
276         if (!m_pSecurityHandler->OnInit(this, m_pEncryptDict)) {
277             return err;
278         }
279         CPDF_CryptoHandler* pCryptoHandler = m_pSecurityHandler->CreateCryptoHandler();
280         if (!pCryptoHandler->Init(m_pEncryptDict, m_pSecurityHandler)) {
281             delete pCryptoHandler;
282             pCryptoHandler = NULL;
283             return PDFPARSE_ERROR_HANDLER;
284         }
285         m_Syntax.SetEncrypt(pCryptoHandler);
286     } else if (m_pEncryptDict) {
287         CFX_ByteString filter = m_pEncryptDict->GetString(FX_BSTRC("Filter"));
288         CPDF_SecurityHandler* pSecurityHandler = NULL;
289         FX_DWORD err = PDFPARSE_ERROR_HANDLER;
290         if (filter == FX_BSTRC("Standard")) {
291             pSecurityHandler = FPDF_CreateStandardSecurityHandler();
292             err = PDFPARSE_ERROR_PASSWORD;
293         }
294         if (pSecurityHandler == NULL) {
295             return PDFPARSE_ERROR_HANDLER;
296         }
297         if (!pSecurityHandler->OnInit(this, m_pEncryptDict)) {
298             delete pSecurityHandler;
299             pSecurityHandler = NULL;
300             return err;
301         }
302         m_pSecurityHandler = pSecurityHandler;
303         CPDF_CryptoHandler* pCryptoHandler = pSecurityHandler->CreateCryptoHandler();
304         if (!pCryptoHandler->Init(m_pEncryptDict, m_pSecurityHandler)) {
305             delete pCryptoHandler;
306             pCryptoHandler = NULL;
307             return PDFPARSE_ERROR_HANDLER;
308         }
309         m_Syntax.SetEncrypt(pCryptoHandler);
310     }
311     return PDFPARSE_ERROR_SUCCESS;
312 }
313 void CPDF_Parser::ReleaseEncryptHandler()
314 {
315     if (m_Syntax.m_pCryptoHandler) {
316         delete m_Syntax.m_pCryptoHandler;
317         m_Syntax.m_pCryptoHandler = NULL;
318     }
319     if (m_pSecurityHandler && !m_bForceUseSecurityHandler) {
320         delete m_pSecurityHandler;
321         m_pSecurityHandler = NULL;
322     }
323 }
324 FX_FILESIZE CPDF_Parser::GetObjectOffset(FX_DWORD objnum)
325 {
326     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
327         return 0;
328     }
329     if (m_V5Type[objnum] == 1) {
330         return m_CrossRef[objnum];
331     }
332     if (m_V5Type[objnum] == 2) {
333         return m_CrossRef[(FX_INT32)m_CrossRef[objnum]];
334     }
335     return 0;
336 }
337 static FX_INT32 GetDirectInteger(CPDF_Dictionary* pDict, FX_BSTR key)
338 {
339     CPDF_Object* pObj = pDict->GetElement(key);
340     if (pObj == NULL) {
341         return 0;
342     }
343     if (pObj->GetType() == PDFOBJ_NUMBER) {
344         return ((CPDF_Number*)pObj)->GetInteger();
345     }
346     return 0;
347 }
348 static FX_BOOL CheckDirectType(CPDF_Dictionary* pDict, FX_BSTR key, FX_INT32 iType)
349 {
350     CPDF_Object* pObj = pDict->GetElement(key);
351     if (!pObj) {
352         return TRUE;
353     }
354     return pObj->GetType() == iType;
355 }
356 FX_BOOL CPDF_Parser::LoadAllCrossRefV4(FX_FILESIZE xrefpos)
357 {
358     if (!LoadCrossRefV4(xrefpos, 0, TRUE, FALSE)) {
359         return FALSE;
360     }
361     m_pTrailer = LoadTrailerV4();
362     if (m_pTrailer == NULL) {
363         return FALSE;
364     }
365     FX_INT32 xrefsize = GetDirectInteger(m_pTrailer, FX_BSTRC("Size"));
366     if (xrefsize <= 0 || xrefsize > (1 << 20)) {
367         return FALSE;
368     }
369     m_CrossRef.SetSize(xrefsize);
370     m_V5Type.SetSize(xrefsize);
371     CFX_FileSizeArray CrossRefList, XRefStreamList;
372     CrossRefList.Add(xrefpos);
373     XRefStreamList.Add(GetDirectInteger(m_pTrailer, FX_BSTRC("XRefStm")));
374     if (!CheckDirectType(m_pTrailer, FX_BSTRC("Prev"), PDFOBJ_NUMBER)) {
375         return FALSE;
376     }
377     FX_FILESIZE newxrefpos = GetDirectInteger(m_pTrailer, FX_BSTRC("Prev"));
378     if (newxrefpos == xrefpos) {
379         return FALSE;
380     }
381     xrefpos = newxrefpos;
382     while (xrefpos) {
383         CrossRefList.InsertAt(0, xrefpos);
384         LoadCrossRefV4(xrefpos, 0, TRUE, FALSE);
385         CPDF_Dictionary* pDict = LoadTrailerV4();
386         if (pDict == NULL) {
387             return FALSE;
388         }
389         if (!CheckDirectType(pDict, FX_BSTRC("Prev"), PDFOBJ_NUMBER)) {
390             pDict->Release();
391             return FALSE;
392         }
393         newxrefpos = GetDirectInteger(pDict, FX_BSTRC("Prev"));
394         if (newxrefpos == xrefpos) {
395             pDict->Release();
396             return FALSE;
397         }
398         xrefpos = newxrefpos;
399         XRefStreamList.InsertAt(0, pDict->GetInteger(FX_BSTRC("XRefStm")));
400         m_Trailers.Add(pDict);
401     }
402     for (FX_INT32 i = 0; i < CrossRefList.GetSize(); i ++)
403         if (!LoadCrossRefV4(CrossRefList[i], XRefStreamList[i], FALSE, i == 0)) {
404             return FALSE;
405         }
406     return TRUE;
407 }
408 FX_BOOL CPDF_Parser::LoadLinearizedAllCrossRefV4(FX_FILESIZE xrefpos, FX_DWORD dwObjCount)
409 {
410     if (!LoadLinearizedCrossRefV4(xrefpos, dwObjCount)) {
411         return FALSE;
412     }
413     m_pTrailer = LoadTrailerV4();
414     if (m_pTrailer == NULL) {
415         return FALSE;
416     }
417     FX_INT32 xrefsize = GetDirectInteger(m_pTrailer, FX_BSTRC("Size"));
418     if (xrefsize == 0) {
419         return FALSE;
420     }
421     CFX_FileSizeArray CrossRefList, XRefStreamList;
422     CrossRefList.Add(xrefpos);
423     XRefStreamList.Add(GetDirectInteger(m_pTrailer, FX_BSTRC("XRefStm")));
424     xrefpos = GetDirectInteger(m_pTrailer, FX_BSTRC("Prev"));
425     while (xrefpos) {
426         CrossRefList.InsertAt(0, xrefpos);
427         LoadCrossRefV4(xrefpos, 0, TRUE, FALSE);
428         CPDF_Dictionary* pDict = LoadTrailerV4();
429         if (pDict == NULL) {
430             return FALSE;
431         }
432         xrefpos = GetDirectInteger(pDict, FX_BSTRC("Prev"));
433         XRefStreamList.InsertAt(0, pDict->GetInteger(FX_BSTRC("XRefStm")));
434         m_Trailers.Add(pDict);
435     }
436     for (FX_INT32 i = 1; i < CrossRefList.GetSize(); i ++)
437         if (!LoadCrossRefV4(CrossRefList[i], XRefStreamList[i], FALSE, i == 0)) {
438             return FALSE;
439         }
440     return TRUE;
441 }
442 FX_BOOL CPDF_Parser::LoadLinearizedCrossRefV4(FX_FILESIZE pos, FX_DWORD dwObjCount)
443 {
444     FX_FILESIZE dwStartPos = pos - m_Syntax.m_HeaderOffset;
445     m_Syntax.RestorePos(dwStartPos);
446     FX_LPVOID pResult = FXSYS_bsearch(&pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
447     if (pResult == NULL) {
448         m_SortedOffset.Add(pos);
449     }
450     FX_DWORD start_objnum = 0;
451     FX_DWORD count = dwObjCount;
452     FX_FILESIZE SavedPos = m_Syntax.SavePos();
453     FX_INT32 recordsize = 20;
454     char* pBuf = FX_Alloc(char, 1024 * recordsize + 1);
455     pBuf[1024 * recordsize] = '\0';
456     FX_INT32 nBlocks = count / 1024 + 1;
457     for (FX_INT32 block = 0; block < nBlocks; block ++) {
458         FX_INT32 block_size = block == nBlocks - 1 ? count % 1024 : 1024;
459         FX_DWORD dwReadSize = block_size * recordsize;
460         if ((FX_FILESIZE)(dwStartPos + dwReadSize) > m_Syntax.m_FileLen) {
461             FX_Free(pBuf);
462             return FALSE;
463         }
464         if (!m_Syntax.ReadBlock((FX_LPBYTE)pBuf, dwReadSize)) {
465             FX_Free(pBuf);
466             return FALSE;
467         }
468         for (FX_INT32 i = 0; i < block_size; i ++) {
469             FX_DWORD objnum = start_objnum + block * 1024 + i;
470             char* pEntry = pBuf + i * recordsize;
471             if (pEntry[17] == 'f') {
472                 m_CrossRef.SetAtGrow(objnum, 0);
473                 m_V5Type.SetAtGrow(objnum, 0);
474             } else {
475                 FX_INT32 offset = FXSYS_atoi(pEntry);
476                 if (offset == 0) {
477                     for (FX_INT32 c = 0; c < 10; c ++) {
478                         if (pEntry[c] < '0' || pEntry[c] > '9') {
479                             FX_Free(pBuf);
480                             return FALSE;
481                         }
482                     }
483                 }
484                 m_CrossRef.SetAtGrow(objnum, offset);
485                 FX_INT32 version = FXSYS_atoi(pEntry + 11);
486                 if (version >= 1) {
487                     m_bVersionUpdated = TRUE;
488                 }
489                 m_ObjVersion.SetAtGrow(objnum, version);
490                 if (m_CrossRef[objnum] < m_Syntax.m_FileLen) {
491                     FX_LPVOID pResult = FXSYS_bsearch(&m_CrossRef[objnum], m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
492                     if (pResult == NULL) {
493                         m_SortedOffset.Add(m_CrossRef[objnum]);
494                     }
495                 }
496                 m_V5Type.SetAtGrow(objnum, 1);
497             }
498         }
499     }
500     FX_Free(pBuf);
501     m_Syntax.RestorePos(SavedPos + count * recordsize);
502     return TRUE;
503 }
504 FX_BOOL CPDF_Parser::LoadCrossRefV4(FX_FILESIZE pos, FX_FILESIZE streampos, FX_BOOL bSkip, FX_BOOL bFirst)
505 {
506     m_Syntax.RestorePos(pos);
507     if (m_Syntax.GetKeyword() != FX_BSTRC("xref")) {
508         return FALSE;
509     }
510     FX_LPVOID pResult = FXSYS_bsearch(&pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
511     if (pResult == NULL) {
512         m_SortedOffset.Add(pos);
513     }
514     if (streampos) {
515         FX_LPVOID pResult = FXSYS_bsearch(&streampos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
516         if (pResult == NULL) {
517             m_SortedOffset.Add(streampos);
518         }
519     }
520     while (1) {
521         FX_FILESIZE SavedPos = m_Syntax.SavePos();
522         FX_BOOL bIsNumber;
523         CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
524         if (word.IsEmpty()) {
525             return FALSE;
526         }
527         if (!bIsNumber) {
528             m_Syntax.RestorePos(SavedPos);
529             break;
530         }
531         FX_DWORD start_objnum = FXSYS_atoi(word);
532         if (start_objnum >= (1 << 20)) {
533             return FALSE;
534         }
535         FX_DWORD count = m_Syntax.GetDirectNum();
536         m_Syntax.ToNextWord();
537         SavedPos = m_Syntax.SavePos();
538         FX_BOOL bFirstItem = FALSE;
539         FX_INT32 recordsize = 20;
540         if (bFirst) {
541             bFirstItem = TRUE;
542         }
543         m_dwXrefStartObjNum = start_objnum;
544         if (!bSkip) {
545             char* pBuf = FX_Alloc(char, 1024 * recordsize + 1);
546             pBuf[1024 * recordsize] = '\0';
547             FX_INT32 nBlocks = count / 1024 + 1;
548             FX_BOOL bFirstBlock = TRUE;
549             for (FX_INT32 block = 0; block < nBlocks; block ++) {
550                 FX_INT32 block_size = block == nBlocks - 1 ? count % 1024 : 1024;
551                 m_Syntax.ReadBlock((FX_LPBYTE)pBuf, block_size * recordsize);
552                 for (FX_INT32 i = 0; i < block_size; i ++) {
553                     FX_DWORD objnum = start_objnum + block * 1024 + i;
554                     char* pEntry = pBuf + i * recordsize;
555                     if (pEntry[17] == 'f') {
556                         if (bFirstItem) {
557                             objnum = 0;
558                             bFirstItem = FALSE;
559                         }
560                         if (bFirstBlock) {
561                             FX_FILESIZE offset = (FX_FILESIZE)FXSYS_atoi64(pEntry);
562                             FX_INT32 version = FXSYS_atoi(pEntry + 11);
563                             if (offset == 0 && version == 65535 && start_objnum != 0) {
564                                 start_objnum--;
565                                 objnum = 0;
566                             }
567                         }
568                         m_CrossRef.SetAtGrow(objnum, 0);
569                         m_V5Type.SetAtGrow(objnum, 0);
570                     } else {
571                         FX_FILESIZE offset = (FX_FILESIZE)FXSYS_atoi64(pEntry);
572                         if (offset == 0) {
573                             for (FX_INT32 c = 0; c < 10; c ++) {
574                                 if (pEntry[c] < '0' || pEntry[c] > '9') {
575                                     FX_Free(pBuf);
576                                     return FALSE;
577                                 }
578                             }
579                         }
580                         m_CrossRef.SetAtGrow(objnum, offset);
581                         FX_INT32 version = FXSYS_atoi(pEntry + 11);
582                         if (version >= 1) {
583                             m_bVersionUpdated = TRUE;
584                         }
585                         m_ObjVersion.SetAtGrow(objnum, version);
586                         if (m_CrossRef[objnum] < m_Syntax.m_FileLen) {
587                             FX_LPVOID pResult = FXSYS_bsearch(&m_CrossRef[objnum], m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
588                             if (pResult == NULL) {
589                                 m_SortedOffset.Add(m_CrossRef[objnum]);
590                             }
591                         }
592                         m_V5Type.SetAtGrow(objnum, 1);
593                     }
594                     if (bFirstBlock) {
595                         bFirstBlock = FALSE;
596                     }
597                 }
598             }
599             FX_Free(pBuf);
600         }
601         m_Syntax.RestorePos(SavedPos + count * recordsize);
602     }
603     if (streampos)
604         if (!LoadCrossRefV5(streampos, streampos, FALSE)) {
605             return FALSE;
606         }
607     return TRUE;
608 }
609 FX_BOOL CPDF_Parser::LoadAllCrossRefV5(FX_FILESIZE xrefpos)
610 {
611     if (!LoadCrossRefV5(xrefpos, xrefpos, TRUE)) {
612         return FALSE;
613     }
614     while (xrefpos)
615         if (!LoadCrossRefV5(xrefpos, xrefpos, FALSE)) {
616             return FALSE;
617         }
618     m_ObjectStreamMap.InitHashTable(101, FALSE);
619     m_bXRefStream = TRUE;
620     return TRUE;
621 }
622 FX_BOOL CPDF_Parser::RebuildCrossRef()
623 {
624     m_CrossRef.RemoveAll();
625     m_V5Type.RemoveAll();
626     m_SortedOffset.RemoveAll();
627     m_ObjVersion.RemoveAll();
628     if (m_pTrailer) {
629         m_pTrailer->Release();
630         m_pTrailer = NULL;
631     }
632     FX_INT32 status = 0;
633     FX_INT32 inside_index = 0;
634     FX_DWORD objnum, gennum;
635     FX_INT32 depth = 0;
636     FX_LPBYTE buffer = FX_Alloc(FX_BYTE, 4096);
637     FX_FILESIZE pos = m_Syntax.m_HeaderOffset;
638     FX_FILESIZE start_pos, start_pos1;
639     FX_FILESIZE last_obj = -1, last_xref = -1, last_trailer = -1;
640     FX_BOOL bInUpdate = FALSE;
641     while (pos < m_Syntax.m_FileLen) {
642         FX_BOOL bOverFlow = FALSE;
643         FX_DWORD size = (FX_DWORD)(m_Syntax.m_FileLen - pos);
644         if (size > 4096) {
645             size = 4096;
646         }
647         if (!m_Syntax.m_pFileAccess->ReadBlock(buffer, pos, size)) {
648             break;
649         }
650         for (FX_DWORD i = 0; i < size; i ++) {
651             FX_BYTE byte = buffer[i];
652             switch (status) {
653                 case 0:
654                     if (PDF_CharType[byte] == 'W') {
655                         status = 1;
656                     }
657                     if (byte <= '9' && byte >= '0') {
658                         --i;
659                         status = 1;
660                     }
661                     if (byte == '%') {
662                         inside_index = 0;
663                         status = 9;
664                     }
665                     if (byte == '(') {
666                         status = 10;
667                         depth = 1;
668                     }
669                     if (byte == '<') {
670                         inside_index = 1;
671                         status = 11;
672                     }
673                     if (byte == '\\') {
674                         status = 13;
675                     }
676                     if (byte == 't') {
677                         status = 7;
678                         inside_index = 1;
679                     }
680                     break;
681                 case 1:
682                     if (PDF_CharType[byte] == 'W') {
683                         break;
684                     } else if (byte <= '9' && byte >= '0') {
685                         start_pos = pos + i;
686                         status = 2;
687                         objnum = byte - '0';
688                     } else if (byte == 't') {
689                         status = 7;
690                         inside_index = 1;
691                     } else if (byte == 'x') {
692                         status = 8;
693                         inside_index = 1;
694                     } else {
695                         --i;
696                         status = 0;
697                     }
698                     break;
699                 case 2:
700                     if (byte <= '9' && byte >= '0') {
701                         objnum = objnum * 10 + byte - '0';
702                         break;
703                     } else if (PDF_CharType[byte] == 'W') {
704                         status = 3;
705                     } else {
706                         --i;
707                         status = 14;
708                         inside_index = 0;
709                     }
710                     break;
711                 case 3:
712                     if (byte <= '9' && byte >= '0') {
713                         start_pos1 = pos + i;
714                         status = 4;
715                         gennum = byte - '0';
716                     } else if (PDF_CharType[byte] == 'W') {
717                         break;
718                     } else if (byte == 't') {
719                         status = 7;
720                         inside_index = 1;
721                     } else {
722                         --i;
723                         status = 0;
724                     }
725                     break;
726                 case 4:
727                     if (byte <= '9' && byte >= '0') {
728                         gennum = gennum * 10 + byte - '0';
729                         break;
730                     } else if (PDF_CharType[byte] == 'W') {
731                         status = 5;
732                     } else {
733                         --i;
734                         status = 0;
735                     }
736                     break;
737                 case 5:
738                     if (byte == 'o') {
739                         status = 6;
740                         inside_index = 1;
741                     } else if (PDF_CharType[byte] == 'W') {
742                         break;
743                     } else if (byte <= '9' && byte >= '0') {
744                         objnum = gennum;
745                         gennum = byte - '0';
746                         start_pos = start_pos1;
747                         start_pos1 = pos + i;
748                         status = 4;
749                     } else if (byte == 't') {
750                         status = 7;
751                         inside_index = 1;
752                     } else {
753                         --i;
754                         status = 0;
755                     }
756                     break;
757                 case 6:
758                     switch (inside_index) {
759                         case 1:
760                             if (byte != 'b') {
761                                 --i;
762                                 status = 0;
763                             } else {
764                                 inside_index ++;
765                             }
766                             break;
767                         case 2:
768                             if (byte != 'j') {
769                                 --i;
770                                 status = 0;
771                             } else {
772                                 inside_index ++;
773                             }
774                             break;
775                         case 3:
776                             if (PDF_CharType[byte] == 'W' || PDF_CharType[byte] == 'D') {
777                                 if (objnum > 0x1000000) {
778                                     status = 0;
779                                     break;
780                                 }
781                                 FX_FILESIZE obj_pos = start_pos - m_Syntax.m_HeaderOffset;
782                                 last_obj = start_pos;
783                                 FX_LPVOID pResult = FXSYS_bsearch(&obj_pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
784                                 if (pResult == NULL) {
785                                     m_SortedOffset.Add(obj_pos);
786                                 }
787                                 FX_FILESIZE obj_end = 0;
788                                 CPDF_Object *pObject = ParseIndirectObjectAtByStrict(m_pDocument, obj_pos, objnum, NULL, &obj_end);
789                                 if (pObject) {
790                                     int iType = pObject->GetType();
791                                     if (iType == PDFOBJ_STREAM) {
792                                         CPDF_Stream* pStream = (CPDF_Stream*)pObject;
793                                         CPDF_Dictionary* pDict = pStream->GetDict();
794                                         if (pDict) {
795                                             if (pDict->KeyExist(FX_BSTRC("Type"))) {
796                                                 CFX_ByteString bsValue = pDict->GetString(FX_BSTRC("Type"));
797                                                 if (bsValue == FX_BSTRC("XRef") && pDict->KeyExist(FX_BSTRC("Size"))) {
798                                                     CPDF_Object* pRoot = pDict->GetElement(FX_BSTRC("Root"));
799                                                     if (pRoot && pRoot->GetDict() && pRoot->GetDict()->GetElement(FX_BSTRC("Pages"))) {
800                                                         if (m_pTrailer) {
801                                                             m_pTrailer->Release();
802                                                         }
803                                                         m_pTrailer = (CPDF_Dictionary*)pDict->Clone();
804                                                     }
805                                                 }
806                                             }
807                                         }
808                                     }
809                                 }
810                                 FX_FILESIZE offset = 0;
811                                 m_Syntax.RestorePos(obj_pos);
812                                 offset = m_Syntax.FindTag(FX_BSTRC("obj"), 0);
813                                 if (offset == -1) {
814                                     offset = 0;
815                                 } else {
816                                     offset += 3;
817                                 }
818                                 FX_FILESIZE nLen = obj_end - obj_pos - offset;
819                                 if ((FX_DWORD)nLen > size - i) {
820                                     pos = obj_end + m_Syntax.m_HeaderOffset;
821                                     bOverFlow = TRUE;
822                                 } else {
823                                     i += (FX_DWORD)nLen;
824                                 }
825                                 if (m_CrossRef.GetSize() > (FX_INT32)objnum && m_CrossRef[objnum]) {
826                                     if (pObject) {
827                                         FX_DWORD oldgen = m_ObjVersion.GetAt(objnum);
828                                         m_CrossRef[objnum] = obj_pos;
829                                         m_ObjVersion.SetAt(objnum, (FX_SHORT)gennum);
830                                         if (oldgen != gennum) {
831                                             m_bVersionUpdated = TRUE;
832                                         }
833                                     }
834                                 } else {
835                                     m_CrossRef.SetAtGrow(objnum, obj_pos);
836                                     m_V5Type.SetAtGrow(objnum, 1);
837                                     m_ObjVersion.SetAtGrow(objnum, (FX_SHORT)gennum);
838                                 }
839                                 if (pObject) {
840                                     pObject->Release();
841                                 }
842                             }
843                             --i;
844                             status = 0;
845                             break;
846                     }
847                     break;
848                 case 7:
849                     if (inside_index == 7) {
850                         if (PDF_CharType[byte] == 'W' || PDF_CharType[byte] == 'D') {
851                             last_trailer = pos + i - 7;
852                             m_Syntax.RestorePos(pos + i - m_Syntax.m_HeaderOffset);
853                             CPDF_Object* pObj = m_Syntax.GetObject(m_pDocument, 0, 0, 0);
854                             if (pObj) {
855                                 if (pObj->GetType() != PDFOBJ_DICTIONARY && pObj->GetType() != PDFOBJ_STREAM) {
856                                     pObj->Release();
857                                 } else {
858                                     CPDF_Dictionary* pTrailer = NULL;
859                                     if (pObj->GetType() == PDFOBJ_STREAM) {
860                                         pTrailer = ((CPDF_Stream*)pObj)->GetDict();
861                                     } else {
862                                         pTrailer = (CPDF_Dictionary*)pObj;
863                                     }
864                                     if (pTrailer) {
865                                         if (m_pTrailer) {
866                                             CPDF_Object* pRoot = pTrailer->GetElement(FX_BSTRC("Root"));
867                                             if (pRoot == NULL || (pRoot->GetType() == PDFOBJ_REFERENCE &&
868                                                                   (FX_DWORD)m_CrossRef.GetSize() > ((CPDF_Reference*)pRoot)->GetRefObjNum() &&
869                                                                   m_CrossRef.GetAt(((CPDF_Reference*)pRoot)->GetRefObjNum()) != 0)) {
870                                                 FX_POSITION pos = pTrailer->GetStartPos();
871                                                 while (pos) {
872                                                     CFX_ByteString key;
873                                                     CPDF_Object* pObj = pTrailer->GetNextElement(pos, key);
874                                                     m_pTrailer->SetAt(key, pObj->Clone(), m_pDocument);
875                                                 }
876                                                 pObj->Release();
877                                             } else {
878                                                 pObj->Release();
879                                             }
880                                         } else {
881                                             if (pObj->GetType() == PDFOBJ_STREAM) {
882                                                 m_pTrailer = (CPDF_Dictionary*)pTrailer->Clone();
883                                                 pObj->Release();
884                                             } else {
885                                                 m_pTrailer = pTrailer;
886                                             }
887                                             FX_FILESIZE dwSavePos = m_Syntax.SavePos();
888                                             CFX_ByteString strWord = m_Syntax.GetKeyword();
889                                             if (!strWord.Compare(FX_BSTRC("startxref"))) {
890                                                 FX_BOOL bNumber = FALSE;
891                                                 CFX_ByteString bsOffset = m_Syntax.GetNextWord(bNumber);
892                                                 if (bNumber) {
893                                                     m_LastXRefOffset = FXSYS_atoi(bsOffset);
894                                                 }
895                                             }
896                                             m_Syntax.RestorePos(dwSavePos);
897                                         }
898                                     } else {
899                                         pObj->Release();
900                                     }
901                                     bInUpdate = TRUE;
902                                 }
903                             }
904                         }
905                         --i;
906                         status = 0;
907                     } else if (byte == "trailer"[inside_index]) {
908                         inside_index ++;
909                     } else {
910                         --i;
911                         status = 0;
912                     }
913                     break;
914                 case 8:
915                     if (inside_index == 4) {
916                         last_xref = pos + i - 4;
917                         status = 1;
918                     } else if (byte == "xref"[inside_index]) {
919                         inside_index ++;
920                     } else {
921                         --i;
922                         status = 0;
923                     }
924                     break;
925                 case 9:
926                     if (byte == '\r' || byte == '\n') {
927                         status = 0;
928                     }
929                     break;
930                 case 10:
931                     if (byte == ')') {
932                         if (depth > 0) {
933                             depth--;
934                         }
935                     } else if (byte == '(') {
936                         depth++;
937                     }
938                     if (!depth) {
939                         status = 0;
940                     }
941                     break;
942                 case 11:
943                     if (byte == '<' && inside_index == 1) {
944                         status = 12;
945                     } else if (byte == '>') {
946                         status = 0;
947                     }
948                     inside_index = 0;
949                     break;
950                 case 12:
951                     --i;
952                     status = 0;
953                     break;
954                 case 13:
955                     if (PDF_CharType[byte] == 'D' || PDF_CharType[byte] == 'W') {
956                         --i;
957                         status = 0;
958                     }
959                     break;
960                 case 14:
961                     if (PDF_CharType[byte] == 'W') {
962                         status = 0;
963                     } else if (byte == '%' || byte == '(' || byte == '<' || byte == '\\') {
964                         status = 0;
965                         --i;
966                     } else if (inside_index == 6) {
967                         status = 0;
968                         --i;
969                     } else if (byte == "endobj"[inside_index]) {
970                         inside_index++;
971                     }
972                     break;
973             }
974             if (bOverFlow) {
975                 size = 0;
976                 break;
977             }
978         }
979         pos += size;
980     }
981     if (last_xref != -1 && last_xref > last_obj) {
982         last_trailer = last_xref;
983     } else if (last_trailer == -1 || last_xref < last_obj) {
984         last_trailer = m_Syntax.m_FileLen;
985     }
986     FX_FILESIZE offset = last_trailer - m_Syntax.m_HeaderOffset;
987     FX_LPVOID pResult = FXSYS_bsearch(&offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
988     if (pResult == NULL) {
989         m_SortedOffset.Add(offset);
990     }
991     FX_Free(buffer);
992     return TRUE;
993 }
994 static FX_DWORD _GetVarInt(FX_LPCBYTE p, FX_INT32 n)
995 {
996     FX_DWORD result = 0;
997     for (FX_INT32 i = 0; i < n; i ++) {
998         result = result * 256 + p[i];
999     }
1000     return result;
1001 }
1002 FX_BOOL CPDF_Parser::LoadCrossRefV5(FX_FILESIZE pos, FX_FILESIZE& prev, FX_BOOL bMainXRef)
1003 {
1004     CPDF_Stream* pStream = (CPDF_Stream*)ParseIndirectObjectAt(m_pDocument, pos, 0, NULL);
1005     if (!pStream) {
1006         return FALSE;
1007     }
1008     if (m_pDocument) {
1009         CPDF_Dictionary * pDict = m_pDocument->GetRoot();
1010         if (!pDict || pDict->GetObjNum() != pStream->m_ObjNum) {
1011             m_pDocument->InsertIndirectObject(pStream->m_ObjNum, pStream);
1012         } else {
1013             if (pStream->GetType() == PDFOBJ_STREAM) {
1014                 pStream->Release();
1015             }
1016             return FALSE;
1017         }
1018     }
1019     if (pStream->GetType() != PDFOBJ_STREAM) {
1020         return FALSE;
1021     }
1022     prev = pStream->GetDict()->GetInteger(FX_BSTRC("Prev"));
1023     FX_INT32 size = pStream->GetDict()->GetInteger(FX_BSTRC("Size"));
1024     if (size < 0) {
1025         pStream->Release();
1026         return FALSE;
1027     }
1028     if (bMainXRef) {
1029         m_pTrailer = (CPDF_Dictionary*)pStream->GetDict()->Clone();
1030         m_CrossRef.SetSize(size);
1031         if (m_V5Type.SetSize(size)) {
1032             FXSYS_memset32(m_V5Type.GetData(), 0, size);
1033         }
1034     } else {
1035         m_Trailers.Add((CPDF_Dictionary*)pStream->GetDict()->Clone());
1036     }
1037     std::vector<std::pair<FX_INT32, FX_INT32> > arrIndex;
1038     CPDF_Array* pArray = pStream->GetDict()->GetArray(FX_BSTRC("Index"));
1039     if (pArray) {
1040         FX_DWORD nPairSize = pArray->GetCount() / 2;
1041         for (FX_DWORD i = 0; i < nPairSize; i++) {
1042             CPDF_Object* pStartNumObj = pArray->GetElement(i * 2);
1043             CPDF_Object* pCountObj = pArray->GetElement(i * 2 + 1);
1044             if (pStartNumObj && pStartNumObj->GetType() == PDFOBJ_NUMBER
1045                 && pCountObj && pCountObj->GetType() == PDFOBJ_NUMBER) {
1046                 int nStartNum = pStartNumObj->GetInteger();
1047                 int nCount = pCountObj->GetInteger();
1048                 if (nStartNum >= 0 && nCount > 0) {
1049                     arrIndex.push_back(std::make_pair(nStartNum, nCount));
1050                 }
1051             }
1052         }
1053     }
1054     if (arrIndex.size() == 0) {
1055         arrIndex.push_back(std::make_pair(0, size));
1056     }
1057     pArray = pStream->GetDict()->GetArray(FX_BSTRC("W"));
1058     if (pArray == NULL) {
1059         pStream->Release();
1060         return FALSE;
1061     }
1062     CFX_DWordArray WidthArray;
1063     FX_SAFE_DWORD dwAccWidth = 0;
1064     for (FX_DWORD i = 0; i < pArray->GetCount(); i ++) {
1065         WidthArray.Add(pArray->GetInteger(i));
1066         dwAccWidth += WidthArray[i];
1067     }
1068     if (!dwAccWidth.IsValid() || WidthArray.GetSize() < 3) {
1069         pStream->Release();
1070         return FALSE;
1071     }
1072     FX_DWORD totalWidth = dwAccWidth.ValueOrDie();
1073     CPDF_StreamAcc acc;
1074     acc.LoadAllData(pStream);
1075     FX_LPCBYTE pData = acc.GetData();
1076     FX_DWORD dwTotalSize = acc.GetSize();
1077     FX_DWORD segindex = 0;
1078     for (FX_DWORD i = 0; i < arrIndex.size(); i ++) {
1079         FX_INT32 startnum = arrIndex[i].first;
1080         if (startnum < 0) {
1081             continue;
1082         }
1083         m_dwXrefStartObjNum = pdfium::base::checked_cast<FX_DWORD, FX_INT32> (startnum);
1084         FX_DWORD count = pdfium::base::checked_cast<FX_DWORD, FX_INT32> (arrIndex[i].second);
1085         FX_SAFE_DWORD dwCaculatedSize = segindex;
1086         dwCaculatedSize += count;
1087         dwCaculatedSize *= totalWidth;
1088         if (!dwCaculatedSize.IsValid() || dwCaculatedSize.ValueOrDie() > dwTotalSize) { 
1089             continue;
1090         }
1091         FX_LPCBYTE segstart = pData + segindex * totalWidth;
1092         FX_SAFE_DWORD dwMaxObjNum = startnum;
1093         dwMaxObjNum += count;
1094         FX_DWORD dwV5Size = pdfium::base::checked_cast<FX_DWORD, FX_INT32> (m_V5Type.GetSize());
1095         if (!dwMaxObjNum.IsValid() || dwMaxObjNum.ValueOrDie() > dwV5Size) {
1096             continue;
1097         }
1098         for (FX_DWORD j = 0; j < count; j ++) {
1099             FX_INT32 type = 1;
1100             FX_LPCBYTE entrystart = segstart + j * totalWidth;
1101             if (WidthArray[0]) {
1102                 type = _GetVarInt(entrystart, WidthArray[0]);
1103             }
1104             if (m_V5Type[startnum + j] == 255) {
1105                 FX_FILESIZE offset = _GetVarInt(entrystart + WidthArray[0], WidthArray[1]);
1106                 m_CrossRef[startnum + j] = offset;
1107                 FX_LPVOID pResult = FXSYS_bsearch(&offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1108                 if (pResult == NULL) {
1109                     m_SortedOffset.Add(offset);
1110                 }
1111                 continue;
1112             }
1113             if (m_V5Type[startnum + j]) {
1114                 continue;
1115             }
1116             m_V5Type[startnum + j] = type;
1117             if (type == 0) {
1118                 m_CrossRef[startnum + j] = 0;
1119             } else {
1120                 FX_FILESIZE offset = _GetVarInt(entrystart + WidthArray[0], WidthArray[1]);
1121                 m_CrossRef[startnum + j] = offset;
1122                 if (type == 1) {
1123                     FX_LPVOID pResult = FXSYS_bsearch(&offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1124                     if (pResult == NULL) {
1125                         m_SortedOffset.Add(offset);
1126                     }
1127                 } else {
1128                     if (offset < 0 || offset >= m_V5Type.GetSize()) {
1129                         pStream->Release();
1130                         return FALSE;
1131                     }
1132                     m_V5Type[offset] = 255;
1133                 }
1134             }
1135         }
1136         segindex += count;
1137     }
1138     pStream->Release();
1139     return TRUE;
1140 }
1141 CPDF_Array* CPDF_Parser::GetIDArray()
1142 {
1143     CPDF_Object* pID = m_pTrailer ? m_pTrailer->GetElement(FX_BSTRC("ID")) : NULL;
1144     if (pID == NULL) {
1145         return NULL;
1146     }
1147     if (pID->GetType() == PDFOBJ_REFERENCE) {
1148         pID = ParseIndirectObject(NULL, ((CPDF_Reference*)pID)->GetRefObjNum());
1149         m_pTrailer->SetAt(FX_BSTRC("ID"), pID);
1150     }
1151     if (pID == NULL || pID->GetType() != PDFOBJ_ARRAY) {
1152         return NULL;
1153     }
1154     return (CPDF_Array*)pID;
1155 }
1156 FX_DWORD CPDF_Parser::GetRootObjNum()
1157 {
1158     CPDF_Object* pRef = m_pTrailer ? m_pTrailer->GetElement(FX_BSTRC("Root")) : NULL;
1159     if (pRef == NULL || pRef->GetType() != PDFOBJ_REFERENCE) {
1160         return 0;
1161     }
1162     return ((CPDF_Reference*) pRef)->GetRefObjNum();
1163 }
1164 FX_DWORD CPDF_Parser::GetInfoObjNum()
1165 {
1166     CPDF_Object* pRef = m_pTrailer ? m_pTrailer->GetElement(FX_BSTRC("Info")) : NULL;
1167     if (pRef == NULL || pRef->GetType() != PDFOBJ_REFERENCE) {
1168         return 0;
1169     }
1170     return ((CPDF_Reference*) pRef)->GetRefObjNum();
1171 }
1172 FX_BOOL CPDF_Parser::IsFormStream(FX_DWORD objnum, FX_BOOL& bForm)
1173 {
1174     bForm = FALSE;
1175     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
1176         return TRUE;
1177     }
1178     if (m_V5Type[objnum] == 0) {
1179         return TRUE;
1180     }
1181     if (m_V5Type[objnum] == 2) {
1182         return TRUE;
1183     }
1184     FX_FILESIZE pos = m_CrossRef[objnum];
1185     FX_LPVOID pResult = FXSYS_bsearch(&pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1186     if (pResult == NULL) {
1187         return TRUE;
1188     }
1189     if ((FX_FILESIZE*)pResult - (FX_FILESIZE*)m_SortedOffset.GetData() == m_SortedOffset.GetSize() - 1) {
1190         return FALSE;
1191     }
1192     FX_FILESIZE size = ((FX_FILESIZE*)pResult)[1] - pos;
1193     FX_FILESIZE SavedPos = m_Syntax.SavePos();
1194     m_Syntax.RestorePos(pos);
1195     bForm = m_Syntax.SearchMultiWord(FX_BSTRC("/Form\0stream"), TRUE, size) == 0;
1196     m_Syntax.RestorePos(SavedPos);
1197     return TRUE;
1198 }
1199 CPDF_Object* CPDF_Parser::ParseIndirectObject(CPDF_IndirectObjects* pObjList, FX_DWORD objnum, PARSE_CONTEXT* pContext)
1200 {
1201     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
1202         return NULL;
1203     }
1204     if (m_V5Type[objnum] == 1 || m_V5Type[objnum] == 255) {
1205         FX_FILESIZE pos = m_CrossRef[objnum];
1206         if (pos <= 0) {
1207             return NULL;
1208         }
1209         return ParseIndirectObjectAt(pObjList, pos, objnum, pContext);
1210     }
1211     if (m_V5Type[objnum] == 2) {
1212         CPDF_StreamAcc* pObjStream = GetObjectStream((FX_DWORD)m_CrossRef[objnum]);
1213         if (pObjStream == NULL) {
1214             return NULL;
1215         }
1216         FX_INT32 n = pObjStream->GetDict()->GetInteger(FX_BSTRC("N"));
1217         FX_INT32 offset = pObjStream->GetDict()->GetInteger(FX_BSTRC("First"));
1218         CPDF_SyntaxParser syntax;
1219         CFX_SmartPointer<IFX_FileStream> file(FX_CreateMemoryStream((FX_LPBYTE)pObjStream->GetData(), (size_t)pObjStream->GetSize(), FALSE));
1220         syntax.InitParser(file.Get(), 0);
1221         CPDF_Object* pRet = NULL;
1222         while (n) {
1223             FX_DWORD thisnum = syntax.GetDirectNum();
1224             FX_DWORD thisoff = syntax.GetDirectNum();
1225             if (thisnum == objnum) {
1226                 syntax.RestorePos(offset + thisoff);
1227                 pRet = syntax.GetObject(pObjList, 0, 0, pContext);
1228                 break;
1229             }
1230             n --;
1231         }
1232         return pRet;
1233     }
1234     return NULL;
1235 }
1236 CPDF_StreamAcc* CPDF_Parser::GetObjectStream(FX_DWORD objnum)
1237 {
1238     CPDF_StreamAcc* pStreamAcc = NULL;
1239     if (m_ObjectStreamMap.Lookup((void*)(FX_UINTPTR)objnum, (void*&)pStreamAcc)) {
1240         return pStreamAcc;
1241     }
1242     const CPDF_Stream* pStream = m_pDocument ? (CPDF_Stream*)m_pDocument->GetIndirectObject(objnum) : NULL;
1243     if (pStream == NULL || pStream->GetType() != PDFOBJ_STREAM) {
1244         return NULL;
1245     }
1246     pStreamAcc = FX_NEW CPDF_StreamAcc;
1247     pStreamAcc->LoadAllData(pStream);
1248     m_ObjectStreamMap.SetAt((void*)(FX_UINTPTR)objnum, pStreamAcc);
1249     return pStreamAcc;
1250 }
1251 FX_FILESIZE CPDF_Parser::GetObjectSize(FX_DWORD objnum)
1252 {
1253     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
1254         return 0;
1255     }
1256     if (m_V5Type[objnum] == 2) {
1257         objnum = (FX_DWORD)m_CrossRef[objnum];
1258     }
1259     if (m_V5Type[objnum] == 1 || m_V5Type[objnum] == 255) {
1260         FX_FILESIZE offset = m_CrossRef[objnum];
1261         if (offset == 0) {
1262             return 0;
1263         }
1264         FX_LPVOID pResult = FXSYS_bsearch(&offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1265         if (pResult == NULL) {
1266             return 0;
1267         }
1268         if ((FX_FILESIZE*)pResult - (FX_FILESIZE*)m_SortedOffset.GetData() == m_SortedOffset.GetSize() - 1) {
1269             return 0;
1270         }
1271         return ((FX_FILESIZE*)pResult)[1] - offset;
1272     }
1273     return 0;
1274 }
1275 void CPDF_Parser::GetIndirectBinary(FX_DWORD objnum, FX_LPBYTE& pBuffer, FX_DWORD& size)
1276 {
1277     pBuffer = NULL;
1278     size = 0;
1279     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
1280         return;
1281     }
1282     if (m_V5Type[objnum] == 2) {
1283         CPDF_StreamAcc* pObjStream = GetObjectStream((FX_DWORD)m_CrossRef[objnum]);
1284         if (pObjStream == NULL) {
1285             return;
1286         }
1287         FX_INT32 n = pObjStream->GetDict()->GetInteger(FX_BSTRC("N"));
1288         FX_INT32 offset = pObjStream->GetDict()->GetInteger(FX_BSTRC("First"));
1289         CPDF_SyntaxParser syntax;
1290         FX_LPCBYTE pData = pObjStream->GetData();
1291         FX_DWORD totalsize = pObjStream->GetSize();
1292         CFX_SmartPointer<IFX_FileStream> file(FX_CreateMemoryStream((FX_LPBYTE)pData, (size_t)totalsize, FALSE));
1293         syntax.InitParser(file.Get(), 0);
1294         while (n) {
1295             FX_DWORD thisnum = syntax.GetDirectNum();
1296             FX_DWORD thisoff = syntax.GetDirectNum();
1297             if (thisnum == objnum) {
1298                 if (n == 1) {
1299                     size = totalsize - (thisoff + offset);
1300                 } else {
1301                     syntax.GetDirectNum();  // Skip nextnum.
1302                     FX_DWORD nextoff = syntax.GetDirectNum();
1303                     size = nextoff - thisoff;
1304                 }
1305                 pBuffer = FX_Alloc(FX_BYTE, size);
1306                 FXSYS_memcpy32(pBuffer, pData + thisoff + offset, size);
1307                 return;
1308             }
1309             n --;
1310         }
1311         return;
1312     }
1313     if (m_V5Type[objnum] == 1) {
1314         FX_FILESIZE pos = m_CrossRef[objnum];
1315         if (pos == 0) {
1316             return;
1317         }
1318         FX_FILESIZE SavedPos = m_Syntax.SavePos();
1319         m_Syntax.RestorePos(pos);
1320         FX_BOOL bIsNumber;
1321         CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
1322         if (!bIsNumber) {
1323             m_Syntax.RestorePos(SavedPos);
1324             return;
1325         }
1326         FX_DWORD parser_objnum = FXSYS_atoi(word);
1327         if (parser_objnum && parser_objnum != objnum) {
1328             m_Syntax.RestorePos(SavedPos);
1329             return;
1330         }
1331         word = m_Syntax.GetNextWord(bIsNumber);
1332         if (!bIsNumber) {
1333             m_Syntax.RestorePos(SavedPos);
1334             return;
1335         }
1336         if (m_Syntax.GetKeyword() != FX_BSTRC("obj")) {
1337             m_Syntax.RestorePos(SavedPos);
1338             return;
1339         }
1340         FX_LPVOID pResult = FXSYS_bsearch(&pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1341         if (pResult == NULL) {
1342             m_Syntax.RestorePos(SavedPos);
1343             return;
1344         }
1345         FX_FILESIZE nextoff = ((FX_FILESIZE*)pResult)[1];
1346         FX_BOOL bNextOffValid = FALSE;
1347         if (nextoff != pos) {
1348             m_Syntax.RestorePos(nextoff);
1349             word = m_Syntax.GetNextWord(bIsNumber);
1350             if (word == FX_BSTRC("xref")) {
1351                 bNextOffValid = TRUE;
1352             } else if (bIsNumber) {
1353                 word = m_Syntax.GetNextWord(bIsNumber);
1354                 if (bIsNumber && m_Syntax.GetKeyword() == FX_BSTRC("obj")) {
1355                     bNextOffValid = TRUE;
1356                 }
1357             }
1358         }
1359         if (!bNextOffValid) {
1360             m_Syntax.RestorePos(pos);
1361             while (1) {
1362                 if (m_Syntax.GetKeyword() == FX_BSTRC("endobj")) {
1363                     break;
1364                 }
1365                 if (m_Syntax.SavePos() == m_Syntax.m_FileLen) {
1366                     break;
1367                 }
1368             }
1369             nextoff = m_Syntax.SavePos();
1370         }
1371         size = (FX_DWORD)(nextoff - pos);
1372         pBuffer = FX_Alloc(FX_BYTE, size);
1373         m_Syntax.RestorePos(pos);
1374         m_Syntax.ReadBlock(pBuffer, size);
1375         m_Syntax.RestorePos(SavedPos);
1376     }
1377 }
1378 CPDF_Object* CPDF_Parser::ParseIndirectObjectAt(CPDF_IndirectObjects* pObjList, FX_FILESIZE pos, FX_DWORD objnum,
1379         PARSE_CONTEXT* pContext)
1380 {
1381     FX_FILESIZE SavedPos = m_Syntax.SavePos();
1382     m_Syntax.RestorePos(pos);
1383     FX_BOOL bIsNumber;
1384     CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
1385     if (!bIsNumber) {
1386         m_Syntax.RestorePos(SavedPos);
1387         return NULL;
1388     }
1389     FX_FILESIZE objOffset = m_Syntax.SavePos();
1390     objOffset -= word.GetLength();
1391     FX_DWORD parser_objnum = FXSYS_atoi(word);
1392     if (objnum && parser_objnum != objnum) {
1393         m_Syntax.RestorePos(SavedPos);
1394         return NULL;
1395     }
1396     word = m_Syntax.GetNextWord(bIsNumber);
1397     if (!bIsNumber) {
1398         m_Syntax.RestorePos(SavedPos);
1399         return NULL;
1400     }
1401     FX_DWORD parser_gennum = FXSYS_atoi(word);
1402     if (m_Syntax.GetKeyword() != FX_BSTRC("obj")) {
1403         m_Syntax.RestorePos(SavedPos);
1404         return NULL;
1405     }
1406     CPDF_Object* pObj = m_Syntax.GetObject(pObjList, objnum, parser_gennum, pContext);
1407     FX_FILESIZE endOffset = m_Syntax.SavePos();
1408     CFX_ByteString bsWord = m_Syntax.GetKeyword();
1409     if (bsWord == FX_BSTRC("endobj")) {
1410         endOffset = m_Syntax.SavePos();
1411     }
1412     m_Syntax.RestorePos(SavedPos);
1413     if (pObj) {
1414         if (!objnum) {
1415             pObj->m_ObjNum = parser_objnum;
1416         }
1417         pObj->m_GenNum = parser_gennum;
1418     }
1419     return pObj;
1420 }
1421 CPDF_Object* CPDF_Parser::ParseIndirectObjectAtByStrict(CPDF_IndirectObjects* pObjList, FX_FILESIZE pos, FX_DWORD objnum,
1422         struct PARSE_CONTEXT* pContext, FX_FILESIZE *pResultPos)
1423 {
1424     FX_FILESIZE SavedPos = m_Syntax.SavePos();
1425     m_Syntax.RestorePos(pos);
1426     FX_BOOL bIsNumber;
1427     CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
1428     if (!bIsNumber) {
1429         m_Syntax.RestorePos(SavedPos);
1430         return NULL;
1431     }
1432     FX_DWORD parser_objnum = FXSYS_atoi(word);
1433     if (objnum && parser_objnum != objnum) {
1434         m_Syntax.RestorePos(SavedPos);
1435         return NULL;
1436     }
1437     word = m_Syntax.GetNextWord(bIsNumber);
1438     if (!bIsNumber) {
1439         m_Syntax.RestorePos(SavedPos);
1440         return NULL;
1441     }
1442     FX_DWORD gennum = FXSYS_atoi(word);
1443     if (m_Syntax.GetKeyword() != FX_BSTRC("obj")) {
1444         m_Syntax.RestorePos(SavedPos);
1445         return NULL;
1446     }
1447     CPDF_Object* pObj = m_Syntax.GetObjectByStrict(pObjList, objnum, gennum, pContext);
1448     if (pResultPos) {
1449         *pResultPos = m_Syntax.m_Pos;
1450     }
1451     m_Syntax.RestorePos(SavedPos);
1452     return pObj;
1453 }
1454 CPDF_Dictionary* CPDF_Parser::LoadTrailerV4()
1455 {
1456     if (m_Syntax.GetKeyword() != FX_BSTRC("trailer")) {
1457         return NULL;
1458     }
1459     CPDF_Object* pObj = m_Syntax.GetObject(m_pDocument, 0, 0, 0);
1460     if (pObj == NULL || pObj->GetType() != PDFOBJ_DICTIONARY) {
1461         if (pObj) {
1462             pObj->Release();
1463         }
1464         return NULL;
1465     }
1466     return (CPDF_Dictionary*)pObj;
1467 }
1468 FX_DWORD CPDF_Parser::GetPermissions(FX_BOOL bCheckRevision)
1469 {
1470     if (m_pSecurityHandler == NULL) {
1471         return (FX_DWORD) - 1;
1472     }
1473     FX_DWORD dwPermission = m_pSecurityHandler->GetPermissions();
1474     if (m_pEncryptDict && m_pEncryptDict->GetString(FX_BSTRC("Filter")) == FX_BSTRC("Standard")) {
1475         dwPermission &= 0xFFFFFFFC;
1476         dwPermission |= 0xFFFFF0C0;
1477         if(bCheckRevision && m_pEncryptDict->GetInteger(FX_BSTRC("R")) == 2) {
1478             dwPermission &= 0xFFFFF0FF;
1479         }
1480     }
1481     return dwPermission;
1482 }
1483 FX_BOOL CPDF_Parser::IsOwner()
1484 {
1485     return m_pSecurityHandler == NULL ? TRUE : m_pSecurityHandler->IsOwner();
1486 }
1487 void CPDF_Parser::SetSecurityHandler(CPDF_SecurityHandler* pSecurityHandler, FX_BOOL bForced)
1488 {
1489     ASSERT(m_pSecurityHandler == NULL);
1490     if (m_pSecurityHandler && !m_bForceUseSecurityHandler) {
1491         delete m_pSecurityHandler;
1492         m_pSecurityHandler = NULL;
1493     }
1494     m_bForceUseSecurityHandler = bForced;
1495     m_pSecurityHandler = pSecurityHandler;
1496     if (m_bForceUseSecurityHandler) {
1497         return;
1498     }
1499     m_Syntax.m_pCryptoHandler = pSecurityHandler->CreateCryptoHandler();
1500     m_Syntax.m_pCryptoHandler->Init(NULL, pSecurityHandler);
1501 }
1502 FX_BOOL CPDF_Parser::IsLinearizedFile(IFX_FileRead* pFileAccess, FX_DWORD offset)
1503 {
1504     m_Syntax.InitParser(pFileAccess, offset);
1505     m_Syntax.RestorePos(m_Syntax.m_HeaderOffset + 9);
1506     FX_FILESIZE SavedPos = m_Syntax.SavePos();
1507     FX_BOOL bIsNumber;
1508     CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
1509     if (!bIsNumber) {
1510         return FALSE;
1511     }
1512     FX_DWORD objnum = FXSYS_atoi(word);
1513     word = m_Syntax.GetNextWord(bIsNumber);
1514     if (!bIsNumber) {
1515         return FALSE;
1516     }
1517     FX_DWORD gennum = FXSYS_atoi(word);
1518     if (m_Syntax.GetKeyword() != FX_BSTRC("obj")) {
1519         m_Syntax.RestorePos(SavedPos);
1520         return FALSE;
1521     }
1522     m_pLinearized = m_Syntax.GetObject(NULL, objnum, gennum, 0);
1523     if (!m_pLinearized) {
1524         return FALSE;
1525     }
1526     if (m_pLinearized->GetDict() && m_pLinearized->GetDict()->GetElement(FX_BSTRC("Linearized"))) {
1527         m_Syntax.GetNextWord(bIsNumber);
1528         CPDF_Object *pLen = m_pLinearized->GetDict()->GetElement(FX_BSTRC("L"));
1529         if (!pLen) {
1530             m_pLinearized->Release();
1531             m_pLinearized = NULL;
1532             return FALSE;
1533         }
1534         if (pLen->GetInteger() != (int)pFileAccess->GetSize()) {
1535             return FALSE;
1536         }
1537         CPDF_Object *pNo = m_pLinearized->GetDict()->GetElement(FX_BSTRC("P"));
1538         if (pNo && pNo->GetType() == PDFOBJ_NUMBER) {
1539             m_dwFirstPageNo = pNo->GetInteger();
1540         }
1541         CPDF_Object *pTable = m_pLinearized->GetDict()->GetElement(FX_BSTRC("T"));
1542         if (pTable && pTable->GetType() == PDFOBJ_NUMBER) {
1543             m_LastXRefOffset = pTable->GetInteger();
1544         }
1545         return TRUE;
1546     }
1547     m_pLinearized->Release();
1548     m_pLinearized = NULL;
1549     return FALSE;
1550 }
1551 FX_DWORD CPDF_Parser::StartAsynParse(IFX_FileRead* pFileAccess, FX_BOOL bReParse, FX_BOOL bOwnFileRead)
1552 {
1553     CloseParser(bReParse);
1554     m_bXRefStream = FALSE;
1555     m_LastXRefOffset = 0;
1556     m_bOwnFileRead = bOwnFileRead;
1557     FX_INT32 offset = GetHeaderOffset(pFileAccess);
1558     if (offset == -1) {
1559         return PDFPARSE_ERROR_FORMAT;
1560     }
1561     if (!IsLinearizedFile(pFileAccess, offset)) {
1562         m_Syntax.m_pFileAccess = NULL;
1563         return StartParse(pFileAccess, bReParse, bOwnFileRead);
1564     }
1565     if (!bReParse) {
1566         m_pDocument = FX_NEW CPDF_Document(this);
1567     }
1568     FX_FILESIZE dwFirstXRefOffset = m_Syntax.SavePos();
1569     FX_BOOL bXRefRebuilt = FALSE;
1570     FX_BOOL bLoadV4 = FALSE;
1571     if (!(bLoadV4 = LoadCrossRefV4(dwFirstXRefOffset, 0, FALSE, FALSE)) && !LoadCrossRefV5(dwFirstXRefOffset, dwFirstXRefOffset, TRUE)) {
1572         if (!RebuildCrossRef()) {
1573             return PDFPARSE_ERROR_FORMAT;
1574         }
1575         bXRefRebuilt = TRUE;
1576         m_LastXRefOffset = 0;
1577     }
1578     if (bLoadV4) {
1579         m_pTrailer = LoadTrailerV4();
1580         if (m_pTrailer == NULL) {
1581             return FALSE;
1582         }
1583         FX_INT32 xrefsize = GetDirectInteger(m_pTrailer, FX_BSTRC("Size"));
1584         if (xrefsize > 0) {
1585             m_CrossRef.SetSize(xrefsize);
1586             m_V5Type.SetSize(xrefsize);
1587         }
1588     }
1589     FX_DWORD dwRet = SetEncryptHandler();
1590     if (dwRet != PDFPARSE_ERROR_SUCCESS) {
1591         return dwRet;
1592     }
1593     m_pDocument->LoadAsynDoc(m_pLinearized->GetDict());
1594     if (m_pDocument->GetRoot() == NULL || m_pDocument->GetPageCount() == 0) {
1595         if (bXRefRebuilt) {
1596             return PDFPARSE_ERROR_FORMAT;
1597         }
1598         ReleaseEncryptHandler();
1599         if (!RebuildCrossRef()) {
1600             return PDFPARSE_ERROR_FORMAT;
1601         }
1602         dwRet = SetEncryptHandler();
1603         if (dwRet != PDFPARSE_ERROR_SUCCESS) {
1604             return dwRet;
1605         }
1606         m_pDocument->LoadAsynDoc(m_pLinearized->GetDict());
1607         if (m_pDocument->GetRoot() == NULL) {
1608             return PDFPARSE_ERROR_FORMAT;
1609         }
1610     }
1611     FXSYS_qsort(m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1612     FX_DWORD RootObjNum = GetRootObjNum();
1613     if (RootObjNum == 0) {
1614         ReleaseEncryptHandler();
1615         RebuildCrossRef();
1616         RootObjNum = GetRootObjNum();
1617         if (RootObjNum == 0) {
1618             return PDFPARSE_ERROR_FORMAT;
1619         }
1620         dwRet = SetEncryptHandler();
1621         if (dwRet != PDFPARSE_ERROR_SUCCESS) {
1622             return dwRet;
1623         }
1624     }
1625     if (m_pSecurityHandler && m_pSecurityHandler->IsMetadataEncrypted()) {
1626         CPDF_Object* pMetadata = m_pDocument->GetRoot()->GetElement(FX_BSTRC("Metadata"));
1627         if (pMetadata && pMetadata->GetType() == PDFOBJ_REFERENCE) {
1628             m_Syntax.m_MetadataObjnum = ((CPDF_Reference*) pMetadata)->GetRefObjNum();
1629         }
1630     }
1631     return PDFPARSE_ERROR_SUCCESS;
1632 }
1633 FX_BOOL CPDF_Parser::LoadLinearizedAllCrossRefV5(FX_FILESIZE xrefpos)
1634 {
1635     if (!LoadCrossRefV5(xrefpos, xrefpos, FALSE)) {
1636         return FALSE;
1637     }
1638     while (xrefpos)
1639         if (!LoadCrossRefV5(xrefpos, xrefpos, FALSE)) {
1640             return FALSE;
1641         }
1642     m_ObjectStreamMap.InitHashTable(101, FALSE);
1643     m_bXRefStream = TRUE;
1644     return TRUE;
1645 }
1646 FX_DWORD CPDF_Parser::LoadLinearizedMainXRefTable()
1647 {
1648     FX_DWORD dwSaveMetadataObjnum = m_Syntax.m_MetadataObjnum;
1649     m_Syntax.m_MetadataObjnum = 0;
1650     if (m_pTrailer) {
1651         m_pTrailer->Release();
1652         m_pTrailer = NULL;
1653     }
1654     m_Syntax.RestorePos(m_LastXRefOffset - m_Syntax.m_HeaderOffset);
1655     FX_BYTE ch = 0;
1656     FX_DWORD dwCount = 0;
1657     m_Syntax.GetNextChar(ch);
1658     FX_INT32 type = PDF_CharType[ch];
1659     while (type == 'W') {
1660         ++dwCount;
1661         if (m_Syntax.m_FileLen >= (FX_FILESIZE)(m_Syntax.SavePos() + m_Syntax.m_HeaderOffset)) {
1662             break;
1663         }
1664         m_Syntax.GetNextChar(ch);
1665         type = PDF_CharType[ch];
1666     }
1667     m_LastXRefOffset += dwCount;
1668     FX_POSITION pos = m_ObjectStreamMap.GetStartPosition();
1669     while (pos) {
1670         FX_LPVOID objnum;
1671         CPDF_StreamAcc* pStream;
1672         m_ObjectStreamMap.GetNextAssoc(pos, objnum, (void*&)pStream);
1673         delete pStream;
1674     }
1675     m_ObjectStreamMap.RemoveAll();
1676     if (!LoadLinearizedAllCrossRefV4(m_LastXRefOffset, m_dwXrefStartObjNum) && !LoadLinearizedAllCrossRefV5(m_LastXRefOffset)) {
1677         m_LastXRefOffset = 0;
1678         m_Syntax.m_MetadataObjnum = dwSaveMetadataObjnum;
1679         return PDFPARSE_ERROR_FORMAT;
1680     }
1681     FXSYS_qsort(m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1682     m_Syntax.m_MetadataObjnum = dwSaveMetadataObjnum;
1683     return PDFPARSE_ERROR_SUCCESS;
1684 }
1685
1686 // static
1687 int CPDF_SyntaxParser::s_CurrentRecursionDepth = 0;
1688
1689 CPDF_SyntaxParser::CPDF_SyntaxParser()
1690 {
1691     m_pFileAccess = NULL;
1692     m_pCryptoHandler = NULL;
1693     m_pFileBuf = NULL;
1694     m_BufSize = CPDF_ModuleMgr::Get()->m_FileBufSize;
1695     m_pFileBuf = NULL;
1696     m_MetadataObjnum = 0;
1697     m_dwWordPos = 0;
1698     m_bFileStream = FALSE;
1699 }
1700 CPDF_SyntaxParser::~CPDF_SyntaxParser()
1701 {
1702     if (m_pFileBuf) {
1703         FX_Free(m_pFileBuf);
1704     }
1705 }
1706 FX_BOOL CPDF_SyntaxParser::GetCharAt(FX_FILESIZE pos, FX_BYTE& ch)
1707 {
1708     FX_FILESIZE save_pos = m_Pos;
1709     m_Pos = pos;
1710     FX_BOOL ret = GetNextChar(ch);
1711     m_Pos = save_pos;
1712     return ret;
1713 }
1714 FX_BOOL CPDF_SyntaxParser::GetNextChar(FX_BYTE& ch)
1715 {
1716     FX_FILESIZE pos = m_Pos + m_HeaderOffset;
1717     if (pos >= m_FileLen) {
1718         return FALSE;
1719     }
1720     if (m_BufOffset >= pos || (FX_FILESIZE)(m_BufOffset + m_BufSize) <= pos) {
1721         FX_FILESIZE read_pos = pos;
1722         FX_DWORD read_size = m_BufSize;
1723         if ((FX_FILESIZE)read_size > m_FileLen) {
1724             read_size = (FX_DWORD)m_FileLen;
1725         }
1726         if ((FX_FILESIZE)(read_pos + read_size) > m_FileLen) {
1727             if (m_FileLen < (FX_FILESIZE)read_size) {
1728                 read_pos = 0;
1729                 read_size = (FX_DWORD)m_FileLen;
1730             } else {
1731                 read_pos = m_FileLen - read_size;
1732             }
1733         }
1734         if (!m_pFileAccess->ReadBlock(m_pFileBuf, read_pos, read_size)) {
1735             return FALSE;
1736         }
1737         m_BufOffset = read_pos;
1738     }
1739     ch = m_pFileBuf[pos - m_BufOffset];
1740     m_Pos ++;
1741     return TRUE;
1742 }
1743 FX_BOOL CPDF_SyntaxParser::GetCharAtBackward(FX_FILESIZE pos, FX_BYTE& ch)
1744 {
1745     pos += m_HeaderOffset;
1746     if (pos >= m_FileLen) {
1747         return FALSE;
1748     }
1749     if (m_BufOffset >= pos || (FX_FILESIZE)(m_BufOffset + m_BufSize) <= pos) {
1750         FX_FILESIZE read_pos;
1751         if (pos < (FX_FILESIZE)m_BufSize) {
1752             read_pos = 0;
1753         } else {
1754             read_pos = pos - m_BufSize + 1;
1755         }
1756         FX_DWORD read_size = m_BufSize;
1757         if ((FX_FILESIZE)(read_pos + read_size) > m_FileLen) {
1758             if (m_FileLen < (FX_FILESIZE)read_size) {
1759                 read_pos = 0;
1760                 read_size = (FX_DWORD)m_FileLen;
1761             } else {
1762                 read_pos = m_FileLen - read_size;
1763             }
1764         }
1765         if (!m_pFileAccess->ReadBlock(m_pFileBuf, read_pos, read_size)) {
1766             return FALSE;
1767         }
1768         m_BufOffset = read_pos;
1769     }
1770     ch = m_pFileBuf[pos - m_BufOffset];
1771     return TRUE;
1772 }
1773 FX_BOOL CPDF_SyntaxParser::ReadBlock(FX_LPBYTE pBuf, FX_DWORD size)
1774 {
1775     if (!m_pFileAccess->ReadBlock(pBuf, m_Pos + m_HeaderOffset, size)) {
1776         return FALSE;
1777     }
1778     m_Pos += size;
1779     return TRUE;
1780 }
1781 #define MAX_WORD_BUFFER 256
1782 void CPDF_SyntaxParser::GetNextWord()
1783 {
1784     m_WordSize = 0;
1785     m_bIsNumber = TRUE;
1786     FX_BYTE ch;
1787     if (!GetNextChar(ch)) {
1788         return;
1789     }
1790     FX_BYTE type = PDF_CharType[ch];
1791     while (1) {
1792         while (type == 'W') {
1793             if (!GetNextChar(ch)) {
1794                 return;
1795             }
1796             type = PDF_CharType[ch];
1797         }
1798         if (ch != '%') {
1799             break;
1800         }
1801         while (1) {
1802             if (!GetNextChar(ch)) {
1803                 return;
1804             }
1805             if (ch == '\r' || ch == '\n') {
1806                 break;
1807             }
1808         }
1809         type = PDF_CharType[ch];
1810     }
1811     if (type == 'D') {
1812         m_bIsNumber = FALSE;
1813         m_WordBuffer[m_WordSize++] = ch;
1814         if (ch == '/') {
1815             while (1) {
1816                 if (!GetNextChar(ch)) {
1817                     return;
1818                 }
1819                 type = PDF_CharType[ch];
1820                 if (type != 'R' && type != 'N') {
1821                     m_Pos --;
1822                     return;
1823                 }
1824                 if (m_WordSize < MAX_WORD_BUFFER) {
1825                     m_WordBuffer[m_WordSize++] = ch;
1826                 }
1827             }
1828         } else if (ch == '<') {
1829             if (!GetNextChar(ch)) {
1830                 return;
1831             }
1832             if (ch == '<') {
1833                 m_WordBuffer[m_WordSize++] = ch;
1834             } else {
1835                 m_Pos --;
1836             }
1837         } else if (ch == '>') {
1838             if (!GetNextChar(ch)) {
1839                 return;
1840             }
1841             if (ch == '>') {
1842                 m_WordBuffer[m_WordSize++] = ch;
1843             } else {
1844                 m_Pos --;
1845             }
1846         }
1847         return;
1848     }
1849     while (1) {
1850         if (m_WordSize < MAX_WORD_BUFFER) {
1851             m_WordBuffer[m_WordSize++] = ch;
1852         }
1853         if (type != 'N') {
1854             m_bIsNumber = FALSE;
1855         }
1856         if (!GetNextChar(ch)) {
1857             return;
1858         }
1859         type = PDF_CharType[ch];
1860         if (type == 'D' || type == 'W') {
1861             m_Pos --;
1862             break;
1863         }
1864     }
1865 }
1866 CFX_ByteString CPDF_SyntaxParser::ReadString()
1867 {
1868     FX_BYTE ch;
1869     if (!GetNextChar(ch)) {
1870         return CFX_ByteString();
1871     }
1872     CFX_ByteTextBuf buf;
1873     FX_INT32 parlevel = 0;
1874     FX_INT32 status = 0, iEscCode = 0;
1875     while (1) {
1876         switch (status) {
1877             case 0:
1878                 if (ch == ')') {
1879                     if (parlevel == 0) {
1880                         return buf.GetByteString();
1881                     }
1882                     parlevel --;
1883                     buf.AppendChar(')');
1884                 } else if (ch == '(') {
1885                     parlevel ++;
1886                     buf.AppendChar('(');
1887                 } else if (ch == '\\') {
1888                     status = 1;
1889                 } else {
1890                     buf.AppendChar(ch);
1891                 }
1892                 break;
1893             case 1:
1894                 if (ch >= '0' && ch <= '7') {
1895                     iEscCode = ch - '0';
1896                     status = 2;
1897                     break;
1898                 }
1899                 if (ch == 'n') {
1900                     buf.AppendChar('\n');
1901                 } else if (ch == 'r') {
1902                     buf.AppendChar('\r');
1903                 } else if (ch == 't') {
1904                     buf.AppendChar('\t');
1905                 } else if (ch == 'b') {
1906                     buf.AppendChar('\b');
1907                 } else if (ch == 'f') {
1908                     buf.AppendChar('\f');
1909                 } else if (ch == '\r') {
1910                     status = 4;
1911                     break;
1912                 } else if (ch == '\n') {
1913                 } else {
1914                     buf.AppendChar(ch);
1915                 }
1916                 status = 0;
1917                 break;
1918             case 2:
1919                 if (ch >= '0' && ch <= '7') {
1920                     iEscCode = iEscCode * 8 + ch - '0';
1921                     status = 3;
1922                 } else {
1923                     buf.AppendChar(iEscCode);
1924                     status = 0;
1925                     continue;
1926                 }
1927                 break;
1928             case 3:
1929                 if (ch >= '0' && ch <= '7') {
1930                     iEscCode = iEscCode * 8 + ch - '0';
1931                     buf.AppendChar(iEscCode);
1932                     status = 0;
1933                 } else {
1934                     buf.AppendChar(iEscCode);
1935                     status = 0;
1936                     continue;
1937                 }
1938                 break;
1939             case 4:
1940                 status = 0;
1941                 if (ch != '\n') {
1942                     continue;
1943                 }
1944                 break;
1945         }
1946         if (!GetNextChar(ch)) {
1947             break;
1948         }
1949     }
1950     GetNextChar(ch);
1951     return buf.GetByteString();
1952 }
1953 CFX_ByteString CPDF_SyntaxParser::ReadHexString()
1954 {
1955     FX_BYTE ch;
1956     if (!GetNextChar(ch)) {
1957         return CFX_ByteString();
1958     }
1959     CFX_BinaryBuf buf;
1960     FX_BOOL bFirst = TRUE;
1961     FX_BYTE code = 0;
1962     while (1) {
1963         if (ch == '>') {
1964             break;
1965         }
1966         if (ch >= '0' && ch <= '9') {
1967             if (bFirst) {
1968                 code = (ch - '0') * 16;
1969             } else {
1970                 code += ch - '0';
1971                 buf.AppendByte((FX_BYTE)code);
1972             }
1973             bFirst = !bFirst;
1974         } else if (ch >= 'A' && ch <= 'F') {
1975             if (bFirst) {
1976                 code = (ch - 'A' + 10) * 16;
1977             } else {
1978                 code += ch - 'A' + 10;
1979                 buf.AppendByte((FX_BYTE)code);
1980             }
1981             bFirst = !bFirst;
1982         } else if (ch >= 'a' && ch <= 'f') {
1983             if (bFirst) {
1984                 code = (ch - 'a' + 10) * 16;
1985             } else {
1986                 code += ch - 'a' + 10;
1987                 buf.AppendByte((FX_BYTE)code);
1988             }
1989             bFirst = !bFirst;
1990         }
1991         if (!GetNextChar(ch)) {
1992             break;
1993         }
1994     }
1995     if (!bFirst) {
1996         buf.AppendByte((FX_BYTE)code);
1997     }
1998     return buf.GetByteString();
1999 }
2000 void CPDF_SyntaxParser::ToNextLine()
2001 {
2002     FX_BYTE ch;
2003     while (1) {
2004         if (!GetNextChar(ch)) {
2005             return;
2006         }
2007         if (ch == '\n') {
2008             return;
2009         }
2010         if (ch == '\r') {
2011             GetNextChar(ch);
2012             if (ch == '\n') {
2013                 return;
2014             } else {
2015                 m_Pos --;
2016                 return;
2017             }
2018         }
2019     }
2020 }
2021 void CPDF_SyntaxParser::ToNextWord()
2022 {
2023     FX_BYTE ch;
2024     if (!GetNextChar(ch)) {
2025         return;
2026     }
2027     FX_BYTE type = PDF_CharType[ch];
2028     while (1) {
2029         while (type == 'W') {
2030             m_dwWordPos = m_Pos;
2031             if (!GetNextChar(ch)) {
2032                 return;
2033             }
2034             type = PDF_CharType[ch];
2035         }
2036         if (ch != '%') {
2037             break;
2038         }
2039         while (1) {
2040             if (!GetNextChar(ch)) {
2041                 return;
2042             }
2043             if (ch == '\r' || ch == '\n') {
2044                 break;
2045             }
2046         }
2047         type = PDF_CharType[ch];
2048     }
2049     m_Pos --;
2050 }
2051 CFX_ByteString CPDF_SyntaxParser::GetNextWord(FX_BOOL& bIsNumber)
2052 {
2053     GetNextWord();
2054     bIsNumber = m_bIsNumber;
2055     return CFX_ByteString((FX_LPCSTR)m_WordBuffer, m_WordSize);
2056 }
2057 CFX_ByteString CPDF_SyntaxParser::GetKeyword()
2058 {
2059     GetNextWord();
2060     return CFX_ByteString((FX_LPCSTR)m_WordBuffer, m_WordSize);
2061 }
2062 CPDF_Object* CPDF_SyntaxParser::GetObject(CPDF_IndirectObjects* pObjList, FX_DWORD objnum, FX_DWORD gennum, PARSE_CONTEXT* pContext, FX_BOOL bDecrypt)
2063 {
2064     CFX_AutoRestorer<int> restorer(&s_CurrentRecursionDepth);
2065     if (++s_CurrentRecursionDepth > kParserMaxRecursionDepth) {
2066         return NULL;
2067     }
2068     FX_FILESIZE SavedPos = m_Pos;
2069     FX_BOOL bTypeOnly = pContext && (pContext->m_Flags & PDFPARSE_TYPEONLY);
2070     FX_BOOL bIsNumber;
2071     CFX_ByteString word = GetNextWord(bIsNumber);
2072     CPDF_Object* pRet = NULL;
2073     if (word.GetLength() == 0) {
2074         if (bTypeOnly) {
2075             return (CPDF_Object*)PDFOBJ_INVALID;
2076         }
2077         return NULL;
2078     }
2079     if (bIsNumber) {
2080         FX_FILESIZE SavedPos = m_Pos;
2081         CFX_ByteString nextword = GetNextWord(bIsNumber);
2082         if (bIsNumber) {
2083             CFX_ByteString nextword2 = GetNextWord(bIsNumber);
2084             if (nextword2 == FX_BSTRC("R")) {
2085                 FX_DWORD objnum = FXSYS_atoi(word);
2086                 if (bTypeOnly) {
2087                     return (CPDF_Object*)PDFOBJ_REFERENCE;
2088                 }
2089                 pRet = CPDF_Reference::Create(pObjList, objnum);
2090                 return pRet;
2091             } else {
2092                 m_Pos = SavedPos;
2093                 if (bTypeOnly) {
2094                     return (CPDF_Object*)PDFOBJ_NUMBER;
2095                 }
2096                 pRet = CPDF_Number::Create(word);
2097                 return pRet;
2098             }
2099         } else {
2100             m_Pos = SavedPos;
2101             if (bTypeOnly) {
2102                 return (CPDF_Object*)PDFOBJ_NUMBER;
2103             }
2104             pRet = CPDF_Number::Create(word);
2105             return pRet;
2106         }
2107     }
2108     if (word == FX_BSTRC("true") || word == FX_BSTRC("false")) {
2109         if (bTypeOnly) {
2110             return (CPDF_Object*)PDFOBJ_BOOLEAN;
2111         }
2112         pRet = CPDF_Boolean::Create(word == FX_BSTRC("true"));
2113         return pRet;
2114     }
2115     if (word == FX_BSTRC("null")) {
2116         if (bTypeOnly) {
2117             return (CPDF_Object*)PDFOBJ_NULL;
2118         }
2119         pRet = CPDF_Null::Create();
2120         return pRet;
2121     }
2122     if (word == FX_BSTRC("(")) {
2123         if (bTypeOnly) {
2124             return (CPDF_Object*)PDFOBJ_STRING;
2125         }
2126         CFX_ByteString str = ReadString();
2127         if (m_pCryptoHandler && bDecrypt) {
2128             m_pCryptoHandler->Decrypt(objnum, gennum, str);
2129         }
2130         pRet = CPDF_String::Create(str, FALSE);
2131         return pRet;
2132     }
2133     if (word == FX_BSTRC("<")) {
2134         if (bTypeOnly) {
2135             return (CPDF_Object*)PDFOBJ_STRING;
2136         }
2137         CFX_ByteString str = ReadHexString();
2138         if (m_pCryptoHandler && bDecrypt) {
2139             m_pCryptoHandler->Decrypt(objnum, gennum, str);
2140         }
2141         pRet = CPDF_String::Create(str, TRUE);
2142         return pRet;
2143     }
2144     if (word == FX_BSTRC("[")) {
2145         if (bTypeOnly) {
2146             return (CPDF_Object*)PDFOBJ_ARRAY;
2147         }
2148         CPDF_Array* pArray = CPDF_Array::Create();
2149         while (1) {
2150             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum);
2151             if (pObj == NULL) {
2152                 return pArray;
2153             }
2154             pArray->Add(pObj);
2155         }
2156     }
2157     if (word[0] == '/') {
2158         if (bTypeOnly) {
2159             return (CPDF_Object*)PDFOBJ_NAME;
2160         }
2161         pRet = CPDF_Name::Create(PDF_NameDecode(CFX_ByteStringC(m_WordBuffer + 1, m_WordSize - 1)));
2162         return pRet;
2163     }
2164     if (word == FX_BSTRC("<<")) {
2165         FX_FILESIZE saveDictOffset = m_Pos - 2;
2166         FX_DWORD dwDictSize = 0;
2167         if (bTypeOnly) {
2168             return (CPDF_Object*)PDFOBJ_DICTIONARY;
2169         }
2170         if (pContext) {
2171             pContext->m_DictStart = SavedPos;
2172         }
2173         CPDF_Dictionary* pDict = CPDF_Dictionary::Create();
2174         FX_INT32 nKeys = 0;
2175         FX_FILESIZE dwSignValuePos = 0;
2176         while (1) {
2177             FX_BOOL bIsNumber;
2178             CFX_ByteString key = GetNextWord(bIsNumber);
2179             if (key.IsEmpty()) {
2180                 if (pDict)
2181                     pDict->Release();
2182                 return NULL;
2183             }
2184             FX_FILESIZE SavedPos = m_Pos - key.GetLength();
2185             if (key == FX_BSTRC(">>")) {
2186                 dwDictSize = m_Pos - saveDictOffset;
2187                 break;
2188             }
2189             if (key == FX_BSTRC("endobj")) {
2190                 dwDictSize = m_Pos - 6 - saveDictOffset;
2191                 m_Pos = SavedPos;
2192                 break;
2193             }
2194             if (key[0] != '/') {
2195                 continue;
2196             }
2197             nKeys ++;
2198             key = PDF_NameDecode(key);
2199             if (key == FX_BSTRC("/Contents")) {
2200                 dwSignValuePos = m_Pos;
2201             }
2202             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum);
2203             if (pObj == NULL) {
2204                 continue;
2205             }
2206             if (key.GetLength() >= 1) {
2207                 if (nKeys < 32) {
2208                     pDict->SetAt(CFX_ByteStringC(key.c_str() + 1, key.GetLength() - 1), pObj);
2209                 } else {
2210                     pDict->AddValue(CFX_ByteStringC(key.c_str() + 1, key.GetLength() - 1), pObj);
2211                 }
2212             }
2213         }
2214         if (IsSignatureDict(pDict)) {
2215             FX_FILESIZE dwSavePos = m_Pos;
2216             m_Pos = dwSignValuePos;
2217             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum, NULL, FALSE);
2218             pDict->SetAt(FX_BSTRC("Contents"), pObj);
2219             m_Pos = dwSavePos;
2220         }
2221         if (pContext) {
2222             pContext->m_DictEnd = m_Pos;
2223             if (pContext->m_Flags & PDFPARSE_NOSTREAM) {
2224                 return pDict;
2225             }
2226         }
2227         FX_FILESIZE SavedPos = m_Pos;
2228         FX_BOOL bIsNumber;
2229         CFX_ByteString nextword = GetNextWord(bIsNumber);
2230         if (nextword == FX_BSTRC("stream")) {
2231             CPDF_Stream* pStream = ReadStream(pDict, pContext, objnum, gennum);
2232             if (pStream) {
2233                 return pStream;
2234             }
2235             if (pDict)
2236                 pDict->Release();
2237             return NULL;
2238         } else {
2239             m_Pos = SavedPos;
2240             return pDict;
2241         }
2242     }
2243     if (word == FX_BSTRC(">>")) {
2244         m_Pos = SavedPos;
2245         return NULL;
2246     }
2247     if (bTypeOnly) {
2248         return (CPDF_Object*)PDFOBJ_INVALID;
2249     }
2250     return NULL;
2251 }
2252 CPDF_Object* CPDF_SyntaxParser::GetObjectByStrict(CPDF_IndirectObjects* pObjList, FX_DWORD objnum, FX_DWORD gennum, struct PARSE_CONTEXT* pContext)
2253 {
2254     CFX_AutoRestorer<int> restorer(&s_CurrentRecursionDepth);
2255     if (++s_CurrentRecursionDepth > kParserMaxRecursionDepth) {
2256         return NULL;
2257     }
2258     FX_FILESIZE SavedPos = m_Pos;
2259     FX_BOOL bTypeOnly = pContext && (pContext->m_Flags & PDFPARSE_TYPEONLY);
2260     FX_BOOL bIsNumber;
2261     CFX_ByteString word = GetNextWord(bIsNumber);
2262     if (word.GetLength() == 0) {
2263         if (bTypeOnly) {
2264             return (CPDF_Object*)PDFOBJ_INVALID;
2265         }
2266         return NULL;
2267     }
2268     if (bIsNumber) {
2269         FX_FILESIZE SavedPos = m_Pos;
2270         CFX_ByteString nextword = GetNextWord(bIsNumber);
2271         if (bIsNumber) {
2272             CFX_ByteString nextword2 = GetNextWord(bIsNumber);
2273             if (nextword2 == FX_BSTRC("R")) {
2274                 FX_DWORD objnum = FXSYS_atoi(word);
2275                 if (bTypeOnly) {
2276                     return (CPDF_Object*)PDFOBJ_REFERENCE;
2277                 }
2278                 return CPDF_Reference::Create(pObjList, objnum);
2279             } else {
2280                 m_Pos = SavedPos;
2281                 if (bTypeOnly) {
2282                     return (CPDF_Object*)PDFOBJ_NUMBER;
2283                 }
2284                 return CPDF_Number::Create(word);
2285             }
2286         } else {
2287             m_Pos = SavedPos;
2288             if (bTypeOnly) {
2289                 return (CPDF_Object*)PDFOBJ_NUMBER;
2290             }
2291             return CPDF_Number::Create(word);
2292         }
2293     }
2294     if (word == FX_BSTRC("true") || word == FX_BSTRC("false")) {
2295         if (bTypeOnly) {
2296             return (CPDF_Object*)PDFOBJ_BOOLEAN;
2297         }
2298         return CPDF_Boolean::Create(word == FX_BSTRC("true"));
2299     }
2300     if (word == FX_BSTRC("null")) {
2301         if (bTypeOnly) {
2302             return (CPDF_Object*)PDFOBJ_NULL;
2303         }
2304         return CPDF_Null::Create();
2305     }
2306     if (word == FX_BSTRC("(")) {
2307         if (bTypeOnly) {
2308             return (CPDF_Object*)PDFOBJ_STRING;
2309         }
2310         CFX_ByteString str = ReadString();
2311         if (m_pCryptoHandler) {
2312             m_pCryptoHandler->Decrypt(objnum, gennum, str);
2313         }
2314         return CPDF_String::Create(str, FALSE);
2315     }
2316     if (word == FX_BSTRC("<")) {
2317         if (bTypeOnly) {
2318             return (CPDF_Object*)PDFOBJ_STRING;
2319         }
2320         CFX_ByteString str = ReadHexString();
2321         if (m_pCryptoHandler) {
2322             m_pCryptoHandler->Decrypt(objnum, gennum, str);
2323         }
2324         return CPDF_String::Create(str, TRUE);
2325     }
2326     if (word == FX_BSTRC("[")) {
2327         if (bTypeOnly) {
2328             return (CPDF_Object*)PDFOBJ_ARRAY;
2329         }
2330         CPDF_Array* pArray = CPDF_Array::Create();
2331         while (1) {
2332             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum);
2333             if (pObj == NULL) {
2334                 if (m_WordBuffer[0] == ']') {
2335                     return pArray;
2336                 }
2337                 if (pArray)
2338                     pArray->Release();
2339                 return NULL;
2340             }
2341             pArray->Add(pObj);
2342         }
2343     }
2344     if (word[0] == '/') {
2345         if (bTypeOnly) {
2346             return (CPDF_Object*)PDFOBJ_NAME;
2347         }
2348         return CPDF_Name::Create(PDF_NameDecode(CFX_ByteStringC(m_WordBuffer + 1, m_WordSize - 1)));
2349     }
2350     if (word == FX_BSTRC("<<")) {
2351         if (bTypeOnly) {
2352             return (CPDF_Object*)PDFOBJ_DICTIONARY;
2353         }
2354         if (pContext) {
2355             pContext->m_DictStart = SavedPos;
2356         }
2357         CPDF_Dictionary* pDict = CPDF_Dictionary::Create();
2358         while (1) {
2359             FX_BOOL bIsNumber;
2360             FX_FILESIZE SavedPos = m_Pos;
2361             CFX_ByteString key = GetNextWord(bIsNumber);
2362             if (key.IsEmpty()) {
2363                 if (pDict)
2364                     pDict->Release();
2365                 return NULL;
2366             }
2367             if (key == FX_BSTRC(">>")) {
2368                 break;
2369             }
2370             if (key == FX_BSTRC("endobj")) {
2371                 m_Pos = SavedPos;
2372                 break;
2373             }
2374             if (key[0] != '/') {
2375                 continue;
2376             }
2377             key = PDF_NameDecode(key);
2378             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum);
2379             if (pObj == NULL) {
2380                 if (pDict)
2381                     pDict->Release();
2382                 FX_BYTE ch;
2383                 while (1) {
2384                     if (!GetNextChar(ch)) {
2385                         break;
2386                     }
2387                     if (ch == 0x0A || ch == 0x0D) {
2388                         break;
2389                     }
2390                 }
2391                 return NULL;
2392             }
2393             if (key.GetLength() == 1) {
2394                 pDict->SetAt(CFX_ByteStringC(key.c_str() + 1, key.GetLength() - 1), pObj);
2395             } else {
2396                 pDict->AddValue(CFX_ByteStringC(key.c_str() + 1, key.GetLength() - 1), pObj);
2397             }
2398         }
2399         if (pContext) {
2400             pContext->m_DictEnd = m_Pos;
2401             if (pContext->m_Flags & PDFPARSE_NOSTREAM) {
2402                 return pDict;
2403             }
2404         }
2405         FX_FILESIZE SavedPos = m_Pos;
2406         FX_BOOL bIsNumber;
2407         CFX_ByteString nextword = GetNextWord(bIsNumber);
2408         if (nextword == FX_BSTRC("stream")) {
2409             CPDF_Stream* pStream = ReadStream(pDict, pContext, objnum, gennum);
2410             if (pStream) {
2411                 return pStream;
2412             }
2413             if (pDict)
2414                 pDict->Release();
2415             return NULL;
2416         } else {
2417             m_Pos = SavedPos;
2418             return pDict;
2419         }
2420     }
2421     if (word == FX_BSTRC(">>")) {
2422         m_Pos = SavedPos;
2423         return NULL;
2424     }
2425     if (bTypeOnly) {
2426         return (CPDF_Object*)PDFOBJ_INVALID;
2427     }
2428     return NULL;
2429 }
2430 CPDF_Stream* CPDF_SyntaxParser::ReadStream(CPDF_Dictionary* pDict, PARSE_CONTEXT* pContext,
2431         FX_DWORD objnum, FX_DWORD gennum)
2432 {
2433     CPDF_Object* pLenObj = pDict->GetElement(FX_BSTRC("Length"));
2434     FX_FILESIZE len = 0;
2435     if (pLenObj && ((pLenObj->GetType() != PDFOBJ_REFERENCE) ||
2436                     ((((CPDF_Reference*)pLenObj)->GetObjList() != NULL) &&
2437                      ((CPDF_Reference*)pLenObj)->GetRefObjNum() != objnum))) {
2438         len = pLenObj->GetInteger();
2439     }
2440
2441     ToNextLine();
2442     FX_FILESIZE StreamStartPos = m_Pos;
2443     if (pContext) {
2444         pContext->m_DataStart = m_Pos;
2445     }
2446
2447     CPDF_CryptoHandler* pCryptoHandler = objnum == (FX_DWORD)m_MetadataObjnum ? NULL : m_pCryptoHandler;
2448     if (pCryptoHandler == NULL) {
2449         pdfium::base::CheckedNumeric<FX_FILESIZE> pos = m_Pos;
2450         pos += len;
2451         if (pos.IsValid() && pos.ValueOrDie() < m_FileLen) {
2452             m_Pos = pos.ValueOrDie();
2453         }
2454         GetNextWord();
2455         if (m_WordSize < 9 || FXSYS_memcmp32(m_WordBuffer, "endstream", 9)) {
2456             m_Pos = StreamStartPos;
2457             FX_FILESIZE offset = FindTag(FX_BSTRC("endstream"), 0);
2458             if (offset >= 0) {
2459                 FX_FILESIZE curPos = m_Pos;
2460                 m_Pos = StreamStartPos;
2461                 FX_FILESIZE endobjOffset = FindTag(FX_BSTRC("endobj"), 0);
2462                 if (endobjOffset < offset && endobjOffset >= 0) {
2463                     offset = endobjOffset;
2464                 } else {
2465                     m_Pos = curPos;
2466                 }
2467                 FX_BYTE byte1, byte2;
2468                 GetCharAt(StreamStartPos + offset - 1, byte1);
2469                 GetCharAt(StreamStartPos + offset - 2, byte2);
2470                 if (byte1 == 0x0a && byte2 == 0x0d) {
2471                     len -= 2;
2472                 } else if (byte1 == 0x0a || byte1 == 0x0d) {
2473                     len --;
2474                 }
2475                 len = (FX_DWORD)offset;
2476                 pDict->SetAtInteger(FX_BSTRC("Length"), len);
2477             } else {
2478                 m_Pos = StreamStartPos;
2479                 if (FindTag(FX_BSTRC("endobj"), 0) < 0) {
2480                     return NULL;
2481                 }
2482             }
2483         }
2484         m_Pos = StreamStartPos;
2485     }
2486     CPDF_Stream* pStream;
2487     FX_LPBYTE pData = FX_Alloc(FX_BYTE, len);
2488     if (!pData) {
2489         return NULL;
2490     }
2491     ReadBlock(pData, len);
2492     if (pCryptoHandler) {
2493         CFX_BinaryBuf dest_buf;
2494         dest_buf.EstimateSize(pCryptoHandler->DecryptGetSize(len));
2495         FX_LPVOID context = pCryptoHandler->DecryptStart(objnum, gennum);
2496         pCryptoHandler->DecryptStream(context, pData, len, dest_buf);
2497         pCryptoHandler->DecryptFinish(context, dest_buf);
2498         FX_Free(pData);
2499         pData = dest_buf.GetBuffer();
2500         len = dest_buf.GetSize();
2501         dest_buf.DetachBuffer();
2502     }
2503     pStream = FX_NEW CPDF_Stream(pData, len, pDict);
2504     if (pContext) {
2505         pContext->m_DataEnd = pContext->m_DataStart + len;
2506     }
2507     StreamStartPos = m_Pos;
2508     GetNextWord();
2509     if (m_WordSize == 6 && 0 == FXSYS_memcmp32(m_WordBuffer, "endobj", 6)) {
2510         m_Pos = StreamStartPos;
2511     }
2512     return pStream;
2513 }
2514 void CPDF_SyntaxParser::InitParser(IFX_FileRead* pFileAccess, FX_DWORD HeaderOffset)
2515 {
2516     if (m_pFileBuf) {
2517         FX_Free(m_pFileBuf);
2518         m_pFileBuf = NULL;
2519     }
2520     m_pFileBuf = FX_Alloc(FX_BYTE, m_BufSize);
2521     m_HeaderOffset = HeaderOffset;
2522     m_FileLen = pFileAccess->GetSize();
2523     m_Pos = 0;
2524     m_pFileAccess = pFileAccess;
2525     m_BufOffset = 0;
2526     pFileAccess->ReadBlock(m_pFileBuf, 0, (size_t)((FX_FILESIZE)m_BufSize > m_FileLen ? m_FileLen : m_BufSize));
2527 }
2528 FX_INT32 CPDF_SyntaxParser::GetDirectNum()
2529 {
2530     GetNextWord();
2531     if (!m_bIsNumber) {
2532         return 0;
2533     }
2534     m_WordBuffer[m_WordSize] = 0;
2535     return FXSYS_atoi((FX_LPCSTR)m_WordBuffer);
2536 }
2537 FX_BOOL CPDF_SyntaxParser::IsWholeWord(FX_FILESIZE startpos, FX_FILESIZE limit, FX_LPCBYTE tag, FX_DWORD taglen)
2538 {
2539     FX_BYTE type = PDF_CharType[tag[0]];
2540     FX_BOOL bCheckLeft = type != 'D' && type != 'W';
2541     type = PDF_CharType[tag[taglen - 1]];
2542     FX_BOOL bCheckRight = type != 'D' && type != 'W';
2543     FX_BYTE ch;
2544     if (bCheckRight && startpos + (FX_INT32)taglen <= limit && GetCharAt(startpos + (FX_INT32)taglen, ch)) {
2545         FX_BYTE type = PDF_CharType[ch];
2546         if (type == 'N' || type == 'R') {
2547             return FALSE;
2548         }
2549     }
2550     if (bCheckLeft && startpos > 0 && GetCharAt(startpos - 1, ch)) {
2551         FX_BYTE type = PDF_CharType[ch];
2552         if (type == 'N' || type == 'R') {
2553             return FALSE;
2554         }
2555     }
2556     return TRUE;
2557 }
2558 FX_BOOL CPDF_SyntaxParser::SearchWord(FX_BSTR tag, FX_BOOL bWholeWord, FX_BOOL bForward, FX_FILESIZE limit)
2559 {
2560     FX_INT32 taglen = tag.GetLength();
2561     if (taglen == 0) {
2562         return FALSE;
2563     }
2564     FX_FILESIZE pos = m_Pos;
2565     FX_INT32 offset = 0;
2566     if (!bForward) {
2567         offset = taglen - 1;
2568     }
2569     FX_LPCBYTE tag_data = tag;
2570     FX_BYTE byte;
2571     while (1) {
2572         if (bForward) {
2573             if (limit) {
2574                 if (pos >= m_Pos + limit) {
2575                     return FALSE;
2576                 }
2577             }
2578             if (!GetCharAt(pos, byte)) {
2579                 return FALSE;
2580             }
2581         } else {
2582             if (limit) {
2583                 if (pos <= m_Pos - limit) {
2584                     return FALSE;
2585                 }
2586             }
2587             if (!GetCharAtBackward(pos, byte)) {
2588                 return FALSE;
2589             }
2590         }
2591         if (byte == tag_data[offset]) {
2592             if (bForward) {
2593                 offset ++;
2594                 if (offset < taglen) {
2595                     pos ++;
2596                     continue;
2597                 }
2598             } else {
2599                 offset --;
2600                 if (offset >= 0) {
2601                     pos --;
2602                     continue;
2603                 }
2604             }
2605             FX_FILESIZE startpos = bForward ? pos - taglen + 1 : pos;
2606             if (!bWholeWord || IsWholeWord(startpos, limit, tag, taglen)) {
2607                 m_Pos = startpos;
2608                 return TRUE;
2609             }
2610         }
2611         if (bForward) {
2612             offset = byte == tag_data[0] ? 1 : 0;
2613             pos ++;
2614         } else {
2615             offset = byte == tag_data[taglen - 1] ? taglen - 2 : taglen - 1;
2616             pos --;
2617         }
2618         if (pos < 0) {
2619             return FALSE;
2620         }
2621     }
2622     return FALSE;
2623 }
2624 struct _SearchTagRecord {
2625     FX_LPCBYTE  m_pTag;
2626     FX_DWORD    m_Len;
2627     FX_DWORD    m_Offset;
2628 };
2629 FX_INT32 CPDF_SyntaxParser::SearchMultiWord(FX_BSTR tags, FX_BOOL bWholeWord, FX_FILESIZE limit)
2630 {
2631     FX_INT32 ntags = 1, i;
2632     for (i = 0; i < tags.GetLength(); i ++)
2633         if (tags[i] == 0) {
2634             ntags ++;
2635         }
2636     _SearchTagRecord* pPatterns = FX_Alloc(_SearchTagRecord, ntags);
2637     FX_DWORD start = 0, itag = 0, max_len = 0;
2638     for (i = 0; i <= tags.GetLength(); i ++) {
2639         if (tags[i] == 0) {
2640             FX_DWORD len = i - start;
2641             if (len > max_len) {
2642                 max_len = len;
2643             }
2644             pPatterns[itag].m_pTag = tags.GetPtr() + start;
2645             pPatterns[itag].m_Len = len;
2646             pPatterns[itag].m_Offset = 0;
2647             start = i + 1;
2648             itag ++;
2649         }
2650     }
2651     FX_FILESIZE pos = m_Pos;
2652     FX_BYTE byte;
2653     GetCharAt(pos++, byte);
2654     FX_INT32 found = -1;
2655     while (1) {
2656         for (i = 0; i < ntags; i ++) {
2657             if (pPatterns[i].m_pTag[pPatterns[i].m_Offset] == byte) {
2658                 pPatterns[i].m_Offset ++;
2659                 if (pPatterns[i].m_Offset == pPatterns[i].m_Len) {
2660                     if (!bWholeWord || IsWholeWord(pos - pPatterns[i].m_Len, limit, pPatterns[i].m_pTag, pPatterns[i].m_Len)) {
2661                         found = i;
2662                         goto end;
2663                     } else {
2664                         if (pPatterns[i].m_pTag[0] == byte) {
2665                             pPatterns[i].m_Offset = 1;
2666                         } else {
2667                             pPatterns[i].m_Offset = 0;
2668                         }
2669                     }
2670                 }
2671             } else {
2672                 if (pPatterns[i].m_pTag[0] == byte) {
2673                     pPatterns[i].m_Offset = 1;
2674                 } else {
2675                     pPatterns[i].m_Offset = 0;
2676                 }
2677             }
2678         }
2679         if (limit && pos >= m_Pos + limit) {
2680             goto end;
2681         }
2682         if (!GetCharAt(pos, byte)) {
2683             goto end;
2684         }
2685         pos ++;
2686     }
2687 end:
2688     FX_Free(pPatterns);
2689     return found;
2690 }
2691 FX_FILESIZE CPDF_SyntaxParser::FindTag(FX_BSTR tag, FX_FILESIZE limit)
2692 {
2693     FX_INT32 taglen = tag.GetLength();
2694     FX_INT32 match = 0;
2695     limit += m_Pos;
2696     FX_FILESIZE startpos = m_Pos;
2697     while (1) {
2698         FX_BYTE ch;
2699         if (!GetNextChar(ch)) {
2700             return -1;
2701         }
2702         if (ch == tag[match]) {
2703             match ++;
2704             if (match == taglen) {
2705                 return m_Pos - startpos - taglen;
2706             }
2707         } else {
2708             match = ch == tag[0] ? 1 : 0;
2709         }
2710         if (limit && m_Pos == limit) {
2711             return -1;
2712         }
2713     }
2714     return -1;
2715 }
2716 void CPDF_SyntaxParser::GetBinary(FX_BYTE* buffer, FX_DWORD size)
2717 {
2718     FX_DWORD offset = 0;
2719     FX_BYTE ch;
2720     while (1) {
2721         if (!GetNextChar(ch)) {
2722             return;
2723         }
2724         buffer[offset++] = ch;
2725         if (offset == size) {
2726             break;
2727         }
2728     }
2729 }
2730
2731 class CPDF_DataAvail FX_FINAL : public IPDF_DataAvail
2732 {
2733 public:
2734     CPDF_DataAvail(IFX_FileAvail* pFileAvail, IFX_FileRead* pFileRead);
2735     ~CPDF_DataAvail();
2736
2737     virtual FX_BOOL                     IsDocAvail(IFX_DownloadHints* pHints)  FX_OVERRIDE;
2738
2739     virtual void                        SetDocument(CPDF_Document* pDoc)  FX_OVERRIDE;
2740
2741     virtual FX_BOOL                     IsPageAvail(int iPage, IFX_DownloadHints* pHints)  FX_OVERRIDE;
2742
2743     virtual FX_INT32                    IsFormAvail(IFX_DownloadHints *pHints)  FX_OVERRIDE;
2744
2745     virtual FX_INT32                    IsLinearizedPDF()  FX_OVERRIDE;
2746
2747     virtual FX_BOOL                     IsLinearized()  FX_OVERRIDE
2748     {
2749         return m_bLinearized;
2750     }
2751
2752     virtual void                        GetLinearizedMainXRefInfo(FX_FILESIZE *pPos, FX_DWORD *pSize)  FX_OVERRIDE;
2753
2754 protected:
2755     static const int kMaxDataAvailRecursionDepth = 64;
2756     static int s_CurrentDataAvailRecursionDepth;
2757
2758     FX_DWORD                            GetObjectSize(FX_DWORD objnum, FX_FILESIZE& offset);
2759     FX_BOOL                             IsObjectsAvail(CFX_PtrArray& obj_array, FX_BOOL bParsePage, IFX_DownloadHints* pHints, CFX_PtrArray &ret_array);
2760     FX_BOOL                             CheckDocStatus(IFX_DownloadHints *pHints);
2761     FX_BOOL                             CheckHeader(IFX_DownloadHints* pHints);
2762     FX_BOOL                             CheckFirstPage(IFX_DownloadHints *pHints);
2763     FX_BOOL                             CheckEnd(IFX_DownloadHints *pHints);
2764     FX_BOOL                             CheckCrossRef(IFX_DownloadHints* pHints);
2765     FX_BOOL                             CheckCrossRefItem(IFX_DownloadHints *pHints);
2766     FX_BOOL                             CheckTrailer(IFX_DownloadHints* pHints);
2767     FX_BOOL                             CheckRoot(IFX_DownloadHints* pHints);
2768     FX_BOOL                             CheckInfo(IFX_DownloadHints* pHints);
2769     FX_BOOL                             CheckPages(IFX_DownloadHints* pHints);
2770     FX_BOOL                             CheckPage(IFX_DownloadHints* pHints);
2771     FX_BOOL                             CheckResources(IFX_DownloadHints* pHints);
2772     FX_BOOL                             CheckAnnots(IFX_DownloadHints* pHints);
2773     FX_BOOL                             CheckAcroForm(IFX_DownloadHints* pHints);
2774     FX_BOOL                             CheckAcroFormSubObject(IFX_DownloadHints* pHints);
2775     FX_BOOL                             CheckTrailerAppend(IFX_DownloadHints* pHints);
2776     FX_BOOL                             CheckPageStatus(IFX_DownloadHints* pHints);
2777     FX_BOOL                             CheckAllCrossRefStream(IFX_DownloadHints *pHints);
2778
2779     FX_DWORD                            CheckCrossRefStream(IFX_DownloadHints *pHints, FX_FILESIZE &xref_offset);
2780     FX_BOOL                             IsLinearizedFile(FX_LPBYTE pData, FX_DWORD dwLen);
2781     void                                SetStartOffset(FX_FILESIZE dwOffset);
2782     FX_BOOL                             GetNextToken(CFX_ByteString &token);
2783     FX_BOOL                             GetNextChar(FX_BYTE &ch);
2784     CPDF_Object *                       ParseIndirectObjectAt(FX_FILESIZE pos, FX_DWORD objnum);
2785     CPDF_Object *                       GetObject(FX_DWORD objnum, IFX_DownloadHints* pHints, FX_BOOL *pExistInFile);
2786     FX_BOOL                             GetPageKids(CPDF_Parser *pParser, CPDF_Object *pPages);
2787     FX_BOOL                             PreparePageItem();
2788     FX_BOOL                             LoadPages(IFX_DownloadHints* pHints);
2789     FX_BOOL                             LoadAllXref(IFX_DownloadHints* pHints);
2790     FX_BOOL                             LoadAllFile(IFX_DownloadHints* pHints);
2791     FX_BOOL                             CheckLinearizedData(IFX_DownloadHints* pHints);
2792     FX_BOOL                             CheckFileResources(IFX_DownloadHints* pHints);
2793     FX_BOOL                             CheckPageAnnots(int iPage, IFX_DownloadHints* pHints);
2794
2795     FX_BOOL                             CheckLinearizedFirstPage(int iPage, IFX_DownloadHints* pHints);
2796     FX_BOOL                             HaveResourceAncestor(CPDF_Dictionary *pDict);
2797     FX_BOOL                             CheckPage(FX_INT32 iPage, IFX_DownloadHints* pHints);
2798     FX_BOOL                             LoadDocPages(IFX_DownloadHints* pHints);
2799     FX_BOOL                             LoadDocPage(FX_INT32 iPage, IFX_DownloadHints* pHints);
2800     FX_BOOL                             CheckPageNode(CPDF_PageNode &pageNodes, FX_INT32 iPage, FX_INT32 &iCount, IFX_DownloadHints* pHints);
2801     FX_BOOL                             CheckUnkownPageNode(FX_DWORD dwPageNo, CPDF_PageNode *pPageNode, IFX_DownloadHints* pHints);
2802     FX_BOOL                             CheckArrayPageNode(FX_DWORD dwPageNo, CPDF_PageNode *pPageNode, IFX_DownloadHints* pHints);
2803     FX_BOOL                             CheckPageCount(IFX_DownloadHints* pHints);
2804     FX_BOOL                             IsFirstCheck(int iPage);
2805     void                                ResetFirstCheck(int iPage);
2806
2807     CPDF_Parser                         m_parser;
2808
2809     CPDF_SyntaxParser                   m_syntaxParser;
2810
2811     CPDF_Object                         *m_pRoot;
2812
2813     FX_DWORD                            m_dwRootObjNum;
2814
2815     FX_DWORD                            m_dwInfoObjNum;
2816
2817     CPDF_Object                         *m_pLinearized;
2818
2819     CPDF_Object                         *m_pTrailer;
2820
2821     FX_BOOL                             m_bDocAvail;
2822
2823     FX_FILESIZE                         m_dwHeaderOffset;
2824
2825     FX_FILESIZE                         m_dwLastXRefOffset;
2826
2827     FX_FILESIZE                         m_dwXRefOffset;
2828
2829     FX_FILESIZE                         m_dwTrailerOffset;
2830
2831     FX_FILESIZE                         m_dwCurrentOffset;
2832
2833     PDF_DATAAVAIL_STATUS                m_docStatus;
2834
2835     FX_FILESIZE                         m_dwFileLen;
2836
2837     CPDF_Document*                      m_pDocument;
2838
2839     CPDF_SortObjNumArray                m_objnum_array;
2840
2841     CFX_PtrArray                        m_objs_array;
2842
2843     FX_FILESIZE                         m_Pos;
2844
2845     FX_FILESIZE                         m_bufferOffset;
2846
2847     FX_DWORD                            m_bufferSize;
2848
2849     CFX_ByteString                      m_WordBuf;
2850
2851     FX_BYTE                             m_WordBuffer[257];
2852
2853     FX_DWORD                            m_WordSize;
2854
2855     FX_BYTE                             m_bufferData[512];
2856
2857     CFX_FileSizeArray                   m_CrossOffset;
2858
2859     CFX_DWordArray                      m_XRefStreamList;
2860
2861     CFX_DWordArray                      m_PageObjList;
2862
2863     FX_DWORD                            m_PagesObjNum;
2864
2865     FX_BOOL                             m_bLinearized;
2866
2867     FX_DWORD                            m_dwFirstPageNo;
2868
2869     FX_BOOL                             m_bLinearedDataOK;
2870
2871     FX_BOOL                             m_bMainXRefLoadTried;
2872
2873     FX_BOOL                             m_bMainXRefLoadedOK;
2874
2875     FX_BOOL                             m_bPagesTreeLoad;
2876
2877     FX_BOOL                             m_bPagesLoad;
2878
2879     CPDF_Parser *                       m_pCurrentParser;
2880
2881     FX_FILESIZE                         m_dwCurrentXRefSteam;
2882
2883     FX_BOOL                             m_bAnnotsLoad;
2884
2885     FX_BOOL                             m_bHaveAcroForm;
2886
2887     FX_DWORD                            m_dwAcroFormObjNum;
2888
2889     FX_BOOL                             m_bAcroFormLoad;
2890
2891     CPDF_Object *                       m_pAcroForm;
2892
2893     CFX_PtrArray                        m_arrayAcroforms;
2894
2895     CPDF_Dictionary *                   m_pPageDict;
2896
2897     CPDF_Object *                       m_pPageResource;
2898
2899     FX_BOOL                             m_bNeedDownLoadResource;
2900
2901     FX_BOOL                             m_bPageLoadedOK;
2902
2903     FX_BOOL                             m_bLinearizedFormParamLoad;
2904
2905     CFX_PtrArray                        m_PagesArray;
2906
2907     FX_DWORD                            m_dwEncryptObjNum;
2908
2909     FX_FILESIZE                         m_dwPrevXRefOffset;
2910
2911     FX_BOOL                             m_bTotalLoadPageTree;
2912
2913     FX_BOOL                             m_bCurPageDictLoadOK;
2914
2915     CPDF_PageNode                       m_pageNodes;
2916
2917     CFX_CMapDWordToDWord *              m_pageMapCheckState;
2918
2919     CFX_CMapDWordToDWord *              m_pagesLoadState;
2920 };
2921
2922 IPDF_DataAvail::IPDF_DataAvail(IFX_FileAvail* pFileAvail, IFX_FileRead* pFileRead) :
2923     m_pFileAvail(pFileAvail),
2924     m_pFileRead(pFileRead) {
2925 }
2926
2927 // static
2928 IPDF_DataAvail* IPDF_DataAvail::Create(IFX_FileAvail* pFileAvail, IFX_FileRead* pFileRead)
2929 {
2930   return FX_NEW CPDF_DataAvail(pFileAvail, pFileRead);
2931 }
2932
2933 // static
2934 int CPDF_DataAvail::s_CurrentDataAvailRecursionDepth = 0;
2935
2936 CPDF_DataAvail::CPDF_DataAvail(IFX_FileAvail* pFileAvail, IFX_FileRead* pFileRead)
2937     : IPDF_DataAvail(pFileAvail, pFileRead)
2938 {
2939     m_Pos = 0;
2940     m_dwFileLen = 0;
2941     if (m_pFileRead) {
2942         m_dwFileLen = (FX_DWORD)m_pFileRead->GetSize();
2943     }
2944     m_dwCurrentOffset = 0;
2945     m_WordSize = 0;
2946     m_dwXRefOffset = 0;
2947     m_bufferOffset = 0;
2948     m_dwFirstPageNo = 0;
2949     m_bufferSize = 0;
2950     m_PagesObjNum = 0;
2951     m_dwCurrentXRefSteam = 0;
2952     m_dwAcroFormObjNum = 0;
2953     m_dwInfoObjNum = 0;
2954     m_pDocument = 0;
2955     m_dwEncryptObjNum = 0;
2956     m_dwPrevXRefOffset = 0;
2957     m_dwLastXRefOffset = 0;
2958     m_bDocAvail = FALSE;
2959     m_bMainXRefLoadTried = FALSE;
2960     m_bDocAvail = FALSE;
2961     m_bLinearized = FALSE;
2962     m_bPagesLoad = FALSE;
2963     m_bPagesTreeLoad = FALSE;
2964     m_bMainXRefLoadedOK = FALSE;
2965     m_bAnnotsLoad = FALSE;
2966     m_bHaveAcroForm = FALSE;
2967     m_bAcroFormLoad = FALSE;
2968     m_bPageLoadedOK = FALSE;
2969     m_bNeedDownLoadResource = FALSE;
2970     m_bLinearizedFormParamLoad = FALSE;
2971     m_pLinearized = NULL;
2972     m_pRoot = NULL;
2973     m_pTrailer = NULL;
2974     m_pCurrentParser = NULL;
2975     m_pAcroForm = NULL;
2976     m_pPageDict = NULL;
2977     m_pPageResource = NULL;
2978     m_pageMapCheckState = NULL;
2979     m_docStatus = PDF_DATAAVAIL_HEADER;
2980     m_parser.m_bOwnFileRead = FALSE;
2981     m_bTotalLoadPageTree = FALSE;
2982     m_bCurPageDictLoadOK = FALSE;
2983     m_bLinearedDataOK = FALSE;
2984     m_pagesLoadState = NULL;
2985 }
2986 CPDF_DataAvail::~CPDF_DataAvail()
2987 {
2988     if (m_pLinearized)  {
2989         m_pLinearized->Release();
2990     }
2991     if (m_pRoot) {
2992         m_pRoot->Release();
2993     }
2994     if (m_pTrailer) {
2995         m_pTrailer->Release();
2996     }
2997     if (m_pageMapCheckState) {
2998         delete m_pageMapCheckState;
2999     }
3000     if (m_pagesLoadState) {
3001         delete m_pagesLoadState;
3002     }
3003     FX_INT32 i = 0;
3004     FX_INT32 iSize = m_arrayAcroforms.GetSize();
3005     for (i = 0; i < iSize; ++i) {
3006         ((CPDF_Object *)m_arrayAcroforms.GetAt(i))->Release();
3007     }
3008 }
3009 void CPDF_DataAvail::SetDocument(CPDF_Document* pDoc)
3010 {
3011     m_pDocument = pDoc;
3012 }
3013 FX_DWORD CPDF_DataAvail::GetObjectSize(FX_DWORD objnum, FX_FILESIZE& offset)
3014 {
3015     CPDF_Parser *pParser = (CPDF_Parser *)(m_pDocument->GetParser());
3016     if (pParser == NULL) {
3017         return 0;
3018     }
3019     if (objnum >= (FX_DWORD)pParser->m_CrossRef.GetSize()) {
3020         return 0;
3021     }
3022     if (pParser->m_V5Type[objnum] == 2) {
3023         objnum = (FX_DWORD)pParser->m_CrossRef[objnum];
3024     }
3025     if (pParser->m_V5Type[objnum] == 1 || pParser->m_V5Type[objnum] == 255) {
3026         offset = pParser->m_CrossRef[objnum];
3027         if (offset == 0) {
3028             return 0;
3029         }
3030         FX_LPVOID pResult = FXSYS_bsearch(&offset, pParser->m_SortedOffset.GetData(), pParser->m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
3031         if (pResult == NULL) {
3032             return 0;
3033         }
3034         if ((FX_FILESIZE*)pResult - (FX_FILESIZE*)pParser->m_SortedOffset.GetData() == pParser->m_SortedOffset.GetSize() - 1) {
3035             return 0;
3036         }
3037         return (FX_DWORD)(((FX_FILESIZE*)pResult)[1] - offset);
3038     }
3039     return 0;
3040 }
3041 FX_BOOL CPDF_DataAvail::IsObjectsAvail(CFX_PtrArray& obj_array, FX_BOOL bParsePage, IFX_DownloadHints* pHints, CFX_PtrArray &ret_array)
3042 {
3043     if (!obj_array.GetSize()) {
3044         return TRUE;
3045     }
3046     FX_DWORD count = 0;
3047     CFX_PtrArray new_obj_array;
3048     FX_INT32 i = 0;
3049     for (i = 0; i < obj_array.GetSize(); i++) {
3050         CPDF_Object *pObj = (CPDF_Object *)obj_array[i];
3051         if (!pObj) {
3052             continue;
3053         }
3054         FX_INT32 type = pObj->GetType();
3055         switch (type) {
3056             case PDFOBJ_ARRAY: {
3057                     CPDF_Array *pArray = pObj->GetArray();
3058                     for (FX_DWORD k = 0; k < pArray->GetCount(); k++) {
3059                         new_obj_array.Add(pArray->GetElement(k));
3060                     }
3061                 }
3062                 break;
3063             case PDFOBJ_STREAM:
3064                 pObj = pObj->GetDict();
3065             case PDFOBJ_DICTIONARY: {
3066                     CPDF_Dictionary *pDict = pObj->GetDict();