Add embedder test comparing with the last patch.
[pdfium.git] / core / src / fpdfapi / fpdf_parser / fpdf_parser_parser.cpp
1 // Copyright 2014 PDFium Authors. All rights reserved.
2 // Use of this source code is governed by a BSD-style license that can be
3 // found in the LICENSE file.
4  
5 // Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com
6
7 #include "../../../include/fpdfapi/fpdf_parser.h"
8 #include "../../../include/fpdfapi/fpdf_module.h"
9 #include "../../../include/fpdfapi/fpdf_page.h"
10 #include "../../../src/fxcrt/fx_safe_types.h"
11 #include "../fpdf_page/pageint.h"
12 #include <utility>
13 #include <vector>
14
15 FX_BOOL IsSignatureDict(const CPDF_Dictionary* pDict)
16 {
17     CPDF_Object* pType = pDict->GetElementValue(FX_BSTRC("Type"));
18     if (!pType) {
19         pType = pDict->GetElementValue(FX_BSTRC("FT"));
20         if (!pType) {
21             return FALSE;
22         }
23     }
24     if (pType->GetString() == FX_BSTRC("Sig")) {
25         return TRUE;
26     }
27     return FALSE;
28 }
29 static int _CompareFileSize(const void* p1, const void* p2)
30 {
31     FX_FILESIZE ret = (*(FX_FILESIZE*)p1) - (*(FX_FILESIZE*)p2);
32     if (ret > 0) {
33         return 1;
34     }
35     if (ret < 0) {
36         return -1;
37     }
38     return 0;
39 }
40
41 CPDF_Parser::CPDF_Parser()
42 {
43     m_pDocument = NULL;
44     m_pTrailer = NULL;
45     m_pEncryptDict = NULL;
46     m_pSecurityHandler = NULL;
47     m_pLinearized = NULL;
48     m_dwFirstPageNo = 0;
49     m_dwXrefStartObjNum = 0;
50     m_bOwnFileRead = TRUE;
51     m_FileVersion = 0;
52     m_bForceUseSecurityHandler = FALSE;
53 }
54 CPDF_Parser::~CPDF_Parser()
55 {
56     CloseParser(FALSE);
57 }
58 FX_DWORD CPDF_Parser::GetLastObjNum()
59 {
60     FX_DWORD dwSize = m_CrossRef.GetSize();
61     return dwSize ? dwSize - 1 : 0;
62 }
63 void CPDF_Parser::SetEncryptDictionary(CPDF_Dictionary* pDict)
64 {
65     m_pEncryptDict = pDict;
66 }
67 void CPDF_Parser::CloseParser(FX_BOOL bReParse)
68 {
69     m_bVersionUpdated = FALSE;
70     if (m_pDocument && !bReParse) {
71         delete m_pDocument;
72         m_pDocument = NULL;
73     }
74     if (m_pTrailer) {
75         m_pTrailer->Release();
76         m_pTrailer = NULL;
77     }
78     ReleaseEncryptHandler();
79     SetEncryptDictionary(NULL);
80     if (m_bOwnFileRead && m_Syntax.m_pFileAccess) {
81         m_Syntax.m_pFileAccess->Release();
82         m_Syntax.m_pFileAccess = NULL;
83     }
84     FX_POSITION pos = m_ObjectStreamMap.GetStartPosition();
85     while (pos) {
86         FX_LPVOID objnum;
87         CPDF_StreamAcc* pStream;
88         m_ObjectStreamMap.GetNextAssoc(pos, objnum, (void*&)pStream);
89         delete pStream;
90     }
91     m_ObjectStreamMap.RemoveAll();
92     m_SortedOffset.RemoveAll();
93     m_CrossRef.RemoveAll();
94     m_V5Type.RemoveAll();
95     m_ObjVersion.RemoveAll();
96     FX_INT32 iLen = m_Trailers.GetSize();
97     for (FX_INT32 i = 0; i < iLen; ++i) {
98         if (CPDF_Dictionary* trailer = m_Trailers.GetAt(i))
99             trailer->Release();
100     }
101     m_Trailers.RemoveAll();
102     if (m_pLinearized) {
103         m_pLinearized->Release();
104         m_pLinearized = NULL;
105     }
106 }
107 static FX_INT32 GetHeaderOffset(IFX_FileRead* pFile)
108 {
109     FX_DWORD tag = FXDWORD_FROM_LSBFIRST(0x46445025);
110     FX_BYTE buf[4];
111     FX_INT32 offset = 0;
112     while (1) {
113         if (!pFile->ReadBlock(buf, offset, 4)) {
114             return -1;
115         }
116         if (*(FX_DWORD*)buf == tag) {
117             return offset;
118         }
119         offset ++;
120         if (offset > 1024) {
121             return -1;
122         }
123     }
124     return -1;
125 }
126 FX_DWORD CPDF_Parser::StartParse(FX_LPCSTR filename, FX_BOOL bReParse)
127 {
128     IFX_FileRead* pFileAccess = FX_CreateFileRead(filename);
129     if (!pFileAccess) {
130         return PDFPARSE_ERROR_FILE;
131     }
132     return StartParse(pFileAccess, bReParse);
133 }
134 FX_DWORD CPDF_Parser::StartParse(FX_LPCWSTR filename, FX_BOOL bReParse)
135 {
136     IFX_FileRead* pFileAccess = FX_CreateFileRead(filename);
137     if (!pFileAccess) {
138         return PDFPARSE_ERROR_FILE;
139     }
140     return StartParse(pFileAccess, bReParse);
141 }
142 CPDF_SecurityHandler* FPDF_CreateStandardSecurityHandler();
143 CPDF_SecurityHandler* FPDF_CreatePubKeyHandler(void*);
144 FX_DWORD CPDF_Parser::StartParse(IFX_FileRead* pFileAccess, FX_BOOL bReParse, FX_BOOL bOwnFileRead)
145 {
146     CloseParser(bReParse);
147     m_bXRefStream = FALSE;
148     m_LastXRefOffset = 0;
149     m_bOwnFileRead = bOwnFileRead;
150     FX_INT32 offset = GetHeaderOffset(pFileAccess);
151     if (offset == -1) {
152         if (bOwnFileRead && pFileAccess) {
153             pFileAccess->Release();
154         }
155         return PDFPARSE_ERROR_FORMAT;
156     }
157     m_Syntax.InitParser(pFileAccess, offset);
158     FX_BYTE ch;
159     if (!m_Syntax.GetCharAt(5, ch)) {
160         return PDFPARSE_ERROR_FORMAT;
161     }
162     if (ch >= '0' && ch <= '9') {
163         m_FileVersion = (ch - '0') * 10;
164     }
165     if (!m_Syntax.GetCharAt(7, ch)) {
166         return PDFPARSE_ERROR_FORMAT;
167     }
168     if (ch >= '0' && ch <= '9') {
169         m_FileVersion += ch - '0';
170     }
171     if (m_Syntax.m_FileLen <  m_Syntax.m_HeaderOffset + 9) {
172         return PDFPARSE_ERROR_FORMAT;
173     }
174     m_Syntax.RestorePos(m_Syntax.m_FileLen - m_Syntax.m_HeaderOffset - 9);
175     if (!bReParse) {
176         m_pDocument = FX_NEW CPDF_Document(this);
177     }
178     FX_BOOL bXRefRebuilt = FALSE;
179     if (m_Syntax.SearchWord(FX_BSTRC("startxref"), TRUE, FALSE, 4096)) {
180         FX_FILESIZE startxref_offset = m_Syntax.SavePos();
181         FX_LPVOID pResult = FXSYS_bsearch(&startxref_offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
182         if (pResult == NULL) {
183             m_SortedOffset.Add(startxref_offset);
184         }
185         m_Syntax.GetKeyword();
186         FX_BOOL bNumber;
187         CFX_ByteString xrefpos_str = m_Syntax.GetNextWord(bNumber);
188         if (!bNumber) {
189             return PDFPARSE_ERROR_FORMAT;
190         }
191         m_LastXRefOffset = (FX_FILESIZE)FXSYS_atoi64(xrefpos_str);
192         if (!LoadAllCrossRefV4(m_LastXRefOffset) && !LoadAllCrossRefV5(m_LastXRefOffset)) {
193             if (!RebuildCrossRef()) {
194                 return PDFPARSE_ERROR_FORMAT;
195             }
196             bXRefRebuilt = TRUE;
197             m_LastXRefOffset = 0;
198         }
199     } else {
200         if (!RebuildCrossRef()) {
201             return PDFPARSE_ERROR_FORMAT;
202         }
203         bXRefRebuilt = TRUE;
204     }
205     FX_DWORD dwRet = SetEncryptHandler();
206     if (dwRet != PDFPARSE_ERROR_SUCCESS) {
207         return dwRet;
208     }
209     m_pDocument->LoadDoc();
210     if (m_pDocument->GetRoot() == NULL || m_pDocument->GetPageCount() == 0) {
211         if (bXRefRebuilt) {
212             return PDFPARSE_ERROR_FORMAT;
213         }
214         ReleaseEncryptHandler();
215         if (!RebuildCrossRef()) {
216             return PDFPARSE_ERROR_FORMAT;
217         }
218         dwRet = SetEncryptHandler();
219         if (dwRet != PDFPARSE_ERROR_SUCCESS) {
220             return dwRet;
221         }
222         m_pDocument->LoadDoc();
223         if (m_pDocument->GetRoot() == NULL) {
224             return PDFPARSE_ERROR_FORMAT;
225         }
226     }
227     FXSYS_qsort(m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
228     FX_DWORD RootObjNum = GetRootObjNum();
229     if (RootObjNum == 0) {
230         ReleaseEncryptHandler();
231         RebuildCrossRef();
232         RootObjNum = GetRootObjNum();
233         if (RootObjNum == 0) {
234             return PDFPARSE_ERROR_FORMAT;
235         }
236         dwRet = SetEncryptHandler();
237         if (dwRet != PDFPARSE_ERROR_SUCCESS) {
238             return dwRet;
239         }
240     }
241     if (m_pSecurityHandler && !m_pSecurityHandler->IsMetadataEncrypted()) {
242         CPDF_Reference* pMetadata = (CPDF_Reference*)m_pDocument->GetRoot()->GetElement(FX_BSTRC("Metadata"));
243         if (pMetadata && pMetadata->GetType() == PDFOBJ_REFERENCE) {
244             m_Syntax.m_MetadataObjnum = pMetadata->GetRefObjNum();
245         }
246     }
247     return PDFPARSE_ERROR_SUCCESS;
248 }
249 FX_DWORD CPDF_Parser::SetEncryptHandler()
250 {
251     ReleaseEncryptHandler();
252     SetEncryptDictionary(NULL);
253     if (m_pTrailer == NULL) {
254         return PDFPARSE_ERROR_FORMAT;
255     }
256     CPDF_Object* pEncryptObj = m_pTrailer->GetElement(FX_BSTRC("Encrypt"));
257     if (pEncryptObj) {
258         if (pEncryptObj->GetType() == PDFOBJ_DICTIONARY) {
259             SetEncryptDictionary((CPDF_Dictionary*)pEncryptObj);
260         } else if (pEncryptObj->GetType() == PDFOBJ_REFERENCE) {
261             pEncryptObj = m_pDocument->GetIndirectObject(((CPDF_Reference*)pEncryptObj)->GetRefObjNum());
262             if (pEncryptObj) {
263                 SetEncryptDictionary(pEncryptObj->GetDict());
264             }
265         }
266     }
267     if (m_bForceUseSecurityHandler) {
268         FX_DWORD err = PDFPARSE_ERROR_HANDLER;
269         if (m_pSecurityHandler == NULL) {
270             return PDFPARSE_ERROR_HANDLER;
271         }
272         if (!m_pSecurityHandler->OnInit(this, m_pEncryptDict)) {
273             return err;
274         }
275         CPDF_CryptoHandler* pCryptoHandler = m_pSecurityHandler->CreateCryptoHandler();
276         if (!pCryptoHandler->Init(m_pEncryptDict, m_pSecurityHandler)) {
277             delete pCryptoHandler;
278             pCryptoHandler = NULL;
279             return PDFPARSE_ERROR_HANDLER;
280         }
281         m_Syntax.SetEncrypt(pCryptoHandler);
282     } else if (m_pEncryptDict) {
283         CFX_ByteString filter = m_pEncryptDict->GetString(FX_BSTRC("Filter"));
284         CPDF_SecurityHandler* pSecurityHandler = NULL;
285         FX_DWORD err = PDFPARSE_ERROR_HANDLER;
286         if (filter == FX_BSTRC("Standard")) {
287             pSecurityHandler = FPDF_CreateStandardSecurityHandler();
288             err = PDFPARSE_ERROR_PASSWORD;
289         }
290         if (pSecurityHandler == NULL) {
291             return PDFPARSE_ERROR_HANDLER;
292         }
293         if (!pSecurityHandler->OnInit(this, m_pEncryptDict)) {
294             delete pSecurityHandler;
295             pSecurityHandler = NULL;
296             return err;
297         }
298         m_pSecurityHandler = pSecurityHandler;
299         CPDF_CryptoHandler* pCryptoHandler = pSecurityHandler->CreateCryptoHandler();
300         if (!pCryptoHandler->Init(m_pEncryptDict, m_pSecurityHandler)) {
301             delete pCryptoHandler;
302             pCryptoHandler = NULL;
303             return PDFPARSE_ERROR_HANDLER;
304         }
305         m_Syntax.SetEncrypt(pCryptoHandler);
306     }
307     return PDFPARSE_ERROR_SUCCESS;
308 }
309 void CPDF_Parser::ReleaseEncryptHandler()
310 {
311     if (m_Syntax.m_pCryptoHandler) {
312         delete m_Syntax.m_pCryptoHandler;
313         m_Syntax.m_pCryptoHandler = NULL;
314     }
315     if (m_pSecurityHandler && !m_bForceUseSecurityHandler) {
316         delete m_pSecurityHandler;
317         m_pSecurityHandler = NULL;
318     }
319 }
320 FX_FILESIZE CPDF_Parser::GetObjectOffset(FX_DWORD objnum)
321 {
322     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
323         return 0;
324     }
325     if (m_V5Type[objnum] == 1) {
326         return m_CrossRef[objnum];
327     }
328     if (m_V5Type[objnum] == 2) {
329         return m_CrossRef[(FX_INT32)m_CrossRef[objnum]];
330     }
331     return 0;
332 }
333 static FX_INT32 GetDirectInteger(CPDF_Dictionary* pDict, FX_BSTR key)
334 {
335     CPDF_Object* pObj = pDict->GetElement(key);
336     if (pObj == NULL) {
337         return 0;
338     }
339     if (pObj->GetType() == PDFOBJ_NUMBER) {
340         return ((CPDF_Number*)pObj)->GetInteger();
341     }
342     return 0;
343 }
344 static FX_BOOL CheckDirectType(CPDF_Dictionary* pDict, FX_BSTR key, FX_INT32 iType)
345 {
346     CPDF_Object* pObj = pDict->GetElement(key);
347     if (!pObj) {
348         return TRUE;
349     }
350     return pObj->GetType() == iType;
351 }
352 FX_BOOL CPDF_Parser::LoadAllCrossRefV4(FX_FILESIZE xrefpos)
353 {
354     if (!LoadCrossRefV4(xrefpos, 0, TRUE, FALSE)) {
355         return FALSE;
356     }
357     m_pTrailer = LoadTrailerV4();
358     if (m_pTrailer == NULL) {
359         return FALSE;
360     }
361     FX_INT32 xrefsize = GetDirectInteger(m_pTrailer, FX_BSTRC("Size"));
362     if (xrefsize <= 0 || xrefsize > (1 << 20)) {
363         return FALSE;
364     }
365     m_CrossRef.SetSize(xrefsize);
366     m_V5Type.SetSize(xrefsize);
367     CFX_FileSizeArray CrossRefList, XRefStreamList;
368     CrossRefList.Add(xrefpos);
369     XRefStreamList.Add(GetDirectInteger(m_pTrailer, FX_BSTRC("XRefStm")));
370     if (!CheckDirectType(m_pTrailer, FX_BSTRC("Prev"), PDFOBJ_NUMBER)) {
371         return FALSE;
372     }
373     FX_FILESIZE newxrefpos = GetDirectInteger(m_pTrailer, FX_BSTRC("Prev"));
374     if (newxrefpos == xrefpos) {
375         return FALSE;
376     }
377     xrefpos = newxrefpos;
378     while (xrefpos) {
379         CrossRefList.InsertAt(0, xrefpos);
380         LoadCrossRefV4(xrefpos, 0, TRUE, FALSE);
381         CPDF_Dictionary* pDict = LoadTrailerV4();
382         if (pDict == NULL) {
383             return FALSE;
384         }
385         if (!CheckDirectType(pDict, FX_BSTRC("Prev"), PDFOBJ_NUMBER)) {
386             pDict->Release();
387             return FALSE;
388         }
389         newxrefpos = GetDirectInteger(pDict, FX_BSTRC("Prev"));
390         if (newxrefpos == xrefpos) {
391             pDict->Release();
392             return FALSE;
393         }
394         xrefpos = newxrefpos;
395         XRefStreamList.InsertAt(0, pDict->GetInteger(FX_BSTRC("XRefStm")));
396         m_Trailers.Add(pDict);
397     }
398     for (FX_INT32 i = 0; i < CrossRefList.GetSize(); i ++)
399         if (!LoadCrossRefV4(CrossRefList[i], XRefStreamList[i], FALSE, i == 0)) {
400             return FALSE;
401         }
402     return TRUE;
403 }
404 FX_BOOL CPDF_Parser::LoadLinearizedAllCrossRefV4(FX_FILESIZE xrefpos, FX_DWORD dwObjCount)
405 {
406     if (!LoadLinearizedCrossRefV4(xrefpos, dwObjCount)) {
407         return FALSE;
408     }
409     m_pTrailer = LoadTrailerV4();
410     if (m_pTrailer == NULL) {
411         return FALSE;
412     }
413     FX_INT32 xrefsize = GetDirectInteger(m_pTrailer, FX_BSTRC("Size"));
414     if (xrefsize == 0) {
415         return FALSE;
416     }
417     CFX_FileSizeArray CrossRefList, XRefStreamList;
418     CrossRefList.Add(xrefpos);
419     XRefStreamList.Add(GetDirectInteger(m_pTrailer, FX_BSTRC("XRefStm")));
420     xrefpos = GetDirectInteger(m_pTrailer, FX_BSTRC("Prev"));
421     while (xrefpos) {
422         CrossRefList.InsertAt(0, xrefpos);
423         LoadCrossRefV4(xrefpos, 0, TRUE, FALSE);
424         CPDF_Dictionary* pDict = LoadTrailerV4();
425         if (pDict == NULL) {
426             return FALSE;
427         }
428         xrefpos = GetDirectInteger(pDict, FX_BSTRC("Prev"));
429         XRefStreamList.InsertAt(0, pDict->GetInteger(FX_BSTRC("XRefStm")));
430         m_Trailers.Add(pDict);
431     }
432     for (FX_INT32 i = 1; i < CrossRefList.GetSize(); i ++)
433         if (!LoadCrossRefV4(CrossRefList[i], XRefStreamList[i], FALSE, i == 0)) {
434             return FALSE;
435         }
436     return TRUE;
437 }
438 FX_BOOL CPDF_Parser::LoadLinearizedCrossRefV4(FX_FILESIZE pos, FX_DWORD dwObjCount)
439 {
440     FX_FILESIZE dwStartPos = pos - m_Syntax.m_HeaderOffset;
441     m_Syntax.RestorePos(dwStartPos);
442     FX_LPVOID pResult = FXSYS_bsearch(&pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
443     if (pResult == NULL) {
444         m_SortedOffset.Add(pos);
445     }
446     FX_DWORD start_objnum = 0;
447     FX_DWORD count = dwObjCount;
448     FX_FILESIZE SavedPos = m_Syntax.SavePos();
449     FX_INT32 recordsize = 20;
450     char* pBuf = FX_Alloc(char, 1024 * recordsize + 1);
451     pBuf[1024 * recordsize] = '\0';
452     FX_INT32 nBlocks = count / 1024 + 1;
453     for (FX_INT32 block = 0; block < nBlocks; block ++) {
454         FX_INT32 block_size = block == nBlocks - 1 ? count % 1024 : 1024;
455         FX_DWORD dwReadSize = block_size * recordsize;
456         if ((FX_FILESIZE)(dwStartPos + dwReadSize) > m_Syntax.m_FileLen) {
457             FX_Free(pBuf);
458             return FALSE;
459         }
460         if (!m_Syntax.ReadBlock((FX_LPBYTE)pBuf, dwReadSize)) {
461             FX_Free(pBuf);
462             return FALSE;
463         }
464         for (FX_INT32 i = 0; i < block_size; i ++) {
465             FX_DWORD objnum = start_objnum + block * 1024 + i;
466             char* pEntry = pBuf + i * recordsize;
467             if (pEntry[17] == 'f') {
468                 m_CrossRef.SetAtGrow(objnum, 0);
469                 m_V5Type.SetAtGrow(objnum, 0);
470             } else {
471                 FX_INT32 offset = FXSYS_atoi(pEntry);
472                 if (offset == 0) {
473                     for (FX_INT32 c = 0; c < 10; c ++) {
474                         if (pEntry[c] < '0' || pEntry[c] > '9') {
475                             FX_Free(pBuf);
476                             return FALSE;
477                         }
478                     }
479                 }
480                 m_CrossRef.SetAtGrow(objnum, offset);
481                 FX_INT32 version = FXSYS_atoi(pEntry + 11);
482                 if (version >= 1) {
483                     m_bVersionUpdated = TRUE;
484                 }
485                 m_ObjVersion.SetAtGrow(objnum, version);
486                 if (m_CrossRef[objnum] < m_Syntax.m_FileLen) {
487                     FX_LPVOID pResult = FXSYS_bsearch(&m_CrossRef[objnum], m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
488                     if (pResult == NULL) {
489                         m_SortedOffset.Add(m_CrossRef[objnum]);
490                     }
491                 }
492                 m_V5Type.SetAtGrow(objnum, 1);
493             }
494         }
495     }
496     FX_Free(pBuf);
497     m_Syntax.RestorePos(SavedPos + count * recordsize);
498     return TRUE;
499 }
500 FX_BOOL CPDF_Parser::LoadCrossRefV4(FX_FILESIZE pos, FX_FILESIZE streampos, FX_BOOL bSkip, FX_BOOL bFirst)
501 {
502     m_Syntax.RestorePos(pos);
503     if (m_Syntax.GetKeyword() != FX_BSTRC("xref")) {
504         return FALSE;
505     }
506     FX_LPVOID pResult = FXSYS_bsearch(&pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
507     if (pResult == NULL) {
508         m_SortedOffset.Add(pos);
509     }
510     if (streampos) {
511         FX_LPVOID pResult = FXSYS_bsearch(&streampos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
512         if (pResult == NULL) {
513             m_SortedOffset.Add(streampos);
514         }
515     }
516     while (1) {
517         FX_FILESIZE SavedPos = m_Syntax.SavePos();
518         FX_BOOL bIsNumber;
519         CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
520         if (word.IsEmpty()) {
521             return FALSE;
522         }
523         if (!bIsNumber) {
524             m_Syntax.RestorePos(SavedPos);
525             break;
526         }
527         FX_DWORD start_objnum = FXSYS_atoi(word);
528         if (start_objnum >= (1 << 20)) {
529             return FALSE;
530         }
531         FX_DWORD count = m_Syntax.GetDirectNum();
532         m_Syntax.ToNextWord();
533         SavedPos = m_Syntax.SavePos();
534         FX_BOOL bFirstItem = FALSE;
535         FX_INT32 recordsize = 20;
536         if (bFirst) {
537             bFirstItem = TRUE;
538         }
539         m_dwXrefStartObjNum = start_objnum;
540         if (!bSkip) {
541             char* pBuf = FX_Alloc(char, 1024 * recordsize + 1);
542             pBuf[1024 * recordsize] = '\0';
543             FX_INT32 nBlocks = count / 1024 + 1;
544             FX_BOOL bFirstBlock = TRUE;
545             for (FX_INT32 block = 0; block < nBlocks; block ++) {
546                 FX_INT32 block_size = block == nBlocks - 1 ? count % 1024 : 1024;
547                 m_Syntax.ReadBlock((FX_LPBYTE)pBuf, block_size * recordsize);
548                 for (FX_INT32 i = 0; i < block_size; i ++) {
549                     FX_DWORD objnum = start_objnum + block * 1024 + i;
550                     char* pEntry = pBuf + i * recordsize;
551                     if (pEntry[17] == 'f') {
552                         if (bFirstItem) {
553                             objnum = 0;
554                             bFirstItem = FALSE;
555                         }
556                         if (bFirstBlock) {
557                             FX_FILESIZE offset = (FX_FILESIZE)FXSYS_atoi64(pEntry);
558                             FX_INT32 version = FXSYS_atoi(pEntry + 11);
559                             if (offset == 0 && version == 65535 && start_objnum != 0) {
560                                 start_objnum--;
561                                 objnum = 0;
562                             }
563                         }
564                         m_CrossRef.SetAtGrow(objnum, 0);
565                         m_V5Type.SetAtGrow(objnum, 0);
566                     } else {
567                         FX_FILESIZE offset = (FX_FILESIZE)FXSYS_atoi64(pEntry);
568                         if (offset == 0) {
569                             for (FX_INT32 c = 0; c < 10; c ++) {
570                                 if (pEntry[c] < '0' || pEntry[c] > '9') {
571                                     FX_Free(pBuf);
572                                     return FALSE;
573                                 }
574                             }
575                         }
576                         m_CrossRef.SetAtGrow(objnum, offset);
577                         FX_INT32 version = FXSYS_atoi(pEntry + 11);
578                         if (version >= 1) {
579                             m_bVersionUpdated = TRUE;
580                         }
581                         m_ObjVersion.SetAtGrow(objnum, version);
582                         if (m_CrossRef[objnum] < m_Syntax.m_FileLen) {
583                             FX_LPVOID pResult = FXSYS_bsearch(&m_CrossRef[objnum], m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
584                             if (pResult == NULL) {
585                                 m_SortedOffset.Add(m_CrossRef[objnum]);
586                             }
587                         }
588                         m_V5Type.SetAtGrow(objnum, 1);
589                     }
590                     if (bFirstBlock) {
591                         bFirstBlock = FALSE;
592                     }
593                 }
594             }
595             FX_Free(pBuf);
596         }
597         m_Syntax.RestorePos(SavedPos + count * recordsize);
598     }
599     if (streampos)
600         if (!LoadCrossRefV5(streampos, streampos, FALSE)) {
601             return FALSE;
602         }
603     return TRUE;
604 }
605 FX_BOOL CPDF_Parser::LoadAllCrossRefV5(FX_FILESIZE xrefpos)
606 {
607     if (!LoadCrossRefV5(xrefpos, xrefpos, TRUE)) {
608         return FALSE;
609     }
610     while (xrefpos)
611         if (!LoadCrossRefV5(xrefpos, xrefpos, FALSE)) {
612             return FALSE;
613         }
614     m_ObjectStreamMap.InitHashTable(101, FALSE);
615     m_bXRefStream = TRUE;
616     return TRUE;
617 }
618 FX_BOOL CPDF_Parser::RebuildCrossRef()
619 {
620     m_CrossRef.RemoveAll();
621     m_V5Type.RemoveAll();
622     m_SortedOffset.RemoveAll();
623     m_ObjVersion.RemoveAll();
624     if (m_pTrailer) {
625         m_pTrailer->Release();
626         m_pTrailer = NULL;
627     }
628     FX_INT32 status = 0;
629     FX_INT32 inside_index = 0;
630     FX_DWORD objnum, gennum;
631     FX_INT32 depth = 0;
632     FX_LPBYTE buffer = FX_Alloc(FX_BYTE, 4096);
633     FX_FILESIZE pos = m_Syntax.m_HeaderOffset;
634     FX_FILESIZE start_pos, start_pos1;
635     FX_FILESIZE last_obj = -1, last_xref = -1, last_trailer = -1;
636     FX_BOOL bInUpdate = FALSE;
637     while (pos < m_Syntax.m_FileLen) {
638         FX_BOOL bOverFlow = FALSE;
639         FX_DWORD size = (FX_DWORD)(m_Syntax.m_FileLen - pos);
640         if (size > 4096) {
641             size = 4096;
642         }
643         if (!m_Syntax.m_pFileAccess->ReadBlock(buffer, pos, size)) {
644             break;
645         }
646         for (FX_DWORD i = 0; i < size; i ++) {
647             FX_BYTE byte = buffer[i];
648             switch (status) {
649                 case 0:
650                     if (PDF_CharType[byte] == 'W') {
651                         status = 1;
652                     }
653                     if (byte <= '9' && byte >= '0') {
654                         --i;
655                         status = 1;
656                     }
657                     if (byte == '%') {
658                         inside_index = 0;
659                         status = 9;
660                     }
661                     if (byte == '(') {
662                         status = 10;
663                         depth = 1;
664                     }
665                     if (byte == '<') {
666                         inside_index = 1;
667                         status = 11;
668                     }
669                     if (byte == '\\') {
670                         status = 13;
671                     }
672                     if (byte == 't') {
673                         status = 7;
674                         inside_index = 1;
675                     }
676                     break;
677                 case 1:
678                     if (PDF_CharType[byte] == 'W') {
679                         break;
680                     } else if (byte <= '9' && byte >= '0') {
681                         start_pos = pos + i;
682                         status = 2;
683                         objnum = byte - '0';
684                     } else if (byte == 't') {
685                         status = 7;
686                         inside_index = 1;
687                     } else if (byte == 'x') {
688                         status = 8;
689                         inside_index = 1;
690                     } else {
691                         --i;
692                         status = 0;
693                     }
694                     break;
695                 case 2:
696                     if (byte <= '9' && byte >= '0') {
697                         objnum = objnum * 10 + byte - '0';
698                         break;
699                     } else if (PDF_CharType[byte] == 'W') {
700                         status = 3;
701                     } else {
702                         --i;
703                         status = 14;
704                         inside_index = 0;
705                     }
706                     break;
707                 case 3:
708                     if (byte <= '9' && byte >= '0') {
709                         start_pos1 = pos + i;
710                         status = 4;
711                         gennum = byte - '0';
712                     } else if (PDF_CharType[byte] == 'W') {
713                         break;
714                     } else if (byte == 't') {
715                         status = 7;
716                         inside_index = 1;
717                     } else {
718                         --i;
719                         status = 0;
720                     }
721                     break;
722                 case 4:
723                     if (byte <= '9' && byte >= '0') {
724                         gennum = gennum * 10 + byte - '0';
725                         break;
726                     } else if (PDF_CharType[byte] == 'W') {
727                         status = 5;
728                     } else {
729                         --i;
730                         status = 0;
731                     }
732                     break;
733                 case 5:
734                     if (byte == 'o') {
735                         status = 6;
736                         inside_index = 1;
737                     } else if (PDF_CharType[byte] == 'W') {
738                         break;
739                     } else if (byte <= '9' && byte >= '0') {
740                         objnum = gennum;
741                         gennum = byte - '0';
742                         start_pos = start_pos1;
743                         start_pos1 = pos + i;
744                         status = 4;
745                     } else if (byte == 't') {
746                         status = 7;
747                         inside_index = 1;
748                     } else {
749                         --i;
750                         status = 0;
751                     }
752                     break;
753                 case 6:
754                     switch (inside_index) {
755                         case 1:
756                             if (byte != 'b') {
757                                 --i;
758                                 status = 0;
759                             } else {
760                                 inside_index ++;
761                             }
762                             break;
763                         case 2:
764                             if (byte != 'j') {
765                                 --i;
766                                 status = 0;
767                             } else {
768                                 inside_index ++;
769                             }
770                             break;
771                         case 3:
772                             if (PDF_CharType[byte] == 'W' || PDF_CharType[byte] == 'D') {
773                                 if (objnum > 0x1000000) {
774                                     status = 0;
775                                     break;
776                                 }
777                                 FX_FILESIZE obj_pos = start_pos - m_Syntax.m_HeaderOffset;
778                                 last_obj = start_pos;
779                                 FX_LPVOID pResult = FXSYS_bsearch(&obj_pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
780                                 if (pResult == NULL) {
781                                     m_SortedOffset.Add(obj_pos);
782                                 }
783                                 FX_FILESIZE obj_end = 0;
784                                 CPDF_Object *pObject = ParseIndirectObjectAtByStrict(m_pDocument, obj_pos, objnum, NULL, &obj_end);
785                                 if (pObject) {
786                                     int iType = pObject->GetType();
787                                     if (iType == PDFOBJ_STREAM) {
788                                         CPDF_Stream* pStream = (CPDF_Stream*)pObject;
789                                         CPDF_Dictionary* pDict = pStream->GetDict();
790                                         if (pDict) {
791                                             if (pDict->KeyExist(FX_BSTRC("Type"))) {
792                                                 CFX_ByteString bsValue = pDict->GetString(FX_BSTRC("Type"));
793                                                 if (bsValue == FX_BSTRC("XRef") && pDict->KeyExist(FX_BSTRC("Size"))) {
794                                                     CPDF_Object* pRoot = pDict->GetElement(FX_BSTRC("Root"));
795                                                     if (pRoot && pRoot->GetDict() && pRoot->GetDict()->GetElement(FX_BSTRC("Pages"))) {
796                                                         if (m_pTrailer) {
797                                                             m_pTrailer->Release();
798                                                         }
799                                                         m_pTrailer = (CPDF_Dictionary*)pDict->Clone();
800                                                     }
801                                                 }
802                                             }
803                                         }
804                                     }
805                                 }
806                                 FX_FILESIZE offset = 0;
807                                 m_Syntax.RestorePos(obj_pos);
808                                 offset = m_Syntax.FindTag(FX_BSTRC("obj"), 0);
809                                 if (offset == -1) {
810                                     offset = 0;
811                                 } else {
812                                     offset += 3;
813                                 }
814                                 FX_FILESIZE nLen = obj_end - obj_pos - offset;
815                                 if ((FX_DWORD)nLen > size - i) {
816                                     pos = obj_end + m_Syntax.m_HeaderOffset;
817                                     bOverFlow = TRUE;
818                                 } else {
819                                     i += (FX_DWORD)nLen;
820                                 }
821                                 if (m_CrossRef.GetSize() > (FX_INT32)objnum && m_CrossRef[objnum]) {
822                                     if (pObject) {
823                                         FX_DWORD oldgen = m_ObjVersion.GetAt(objnum);
824                                         m_CrossRef[objnum] = obj_pos;
825                                         m_ObjVersion.SetAt(objnum, (FX_SHORT)gennum);
826                                         if (oldgen != gennum) {
827                                             m_bVersionUpdated = TRUE;
828                                         }
829                                     }
830                                 } else {
831                                     m_CrossRef.SetAtGrow(objnum, obj_pos);
832                                     m_V5Type.SetAtGrow(objnum, 1);
833                                     m_ObjVersion.SetAtGrow(objnum, (FX_SHORT)gennum);
834                                 }
835                                 if (pObject) {
836                                     pObject->Release();
837                                 }
838                             }
839                             --i;
840                             status = 0;
841                             break;
842                     }
843                     break;
844                 case 7:
845                     if (inside_index == 7) {
846                         if (PDF_CharType[byte] == 'W' || PDF_CharType[byte] == 'D') {
847                             last_trailer = pos + i - 7;
848                             m_Syntax.RestorePos(pos + i - m_Syntax.m_HeaderOffset);
849                             CPDF_Object* pObj = m_Syntax.GetObject(m_pDocument, 0, 0, 0);
850                             if (pObj) {
851                                 if (pObj->GetType() != PDFOBJ_DICTIONARY && pObj->GetType() != PDFOBJ_STREAM) {
852                                     pObj->Release();
853                                 } else {
854                                     CPDF_Dictionary* pTrailer = NULL;
855                                     if (pObj->GetType() == PDFOBJ_STREAM) {
856                                         pTrailer = ((CPDF_Stream*)pObj)->GetDict();
857                                     } else {
858                                         pTrailer = (CPDF_Dictionary*)pObj;
859                                     }
860                                     if (pTrailer) {
861                                         if (m_pTrailer) {
862                                             CPDF_Object* pRoot = pTrailer->GetElement(FX_BSTRC("Root"));
863                                             if (pRoot == NULL || (pRoot->GetType() == PDFOBJ_REFERENCE &&
864                                                                   (FX_DWORD)m_CrossRef.GetSize() > ((CPDF_Reference*)pRoot)->GetRefObjNum() &&
865                                                                   m_CrossRef.GetAt(((CPDF_Reference*)pRoot)->GetRefObjNum()) != 0)) {
866                                                 FX_POSITION pos = pTrailer->GetStartPos();
867                                                 while (pos) {
868                                                     CFX_ByteString key;
869                                                     CPDF_Object* pObj = pTrailer->GetNextElement(pos, key);
870                                                     m_pTrailer->SetAt(key, pObj->Clone(), m_pDocument);
871                                                 }
872                                                 pObj->Release();
873                                             } else {
874                                                 pObj->Release();
875                                             }
876                                         } else {
877                                             if (pObj->GetType() == PDFOBJ_STREAM) {
878                                                 m_pTrailer = (CPDF_Dictionary*)pTrailer->Clone();
879                                                 pObj->Release();
880                                             } else {
881                                                 m_pTrailer = pTrailer;
882                                             }
883                                             FX_FILESIZE dwSavePos = m_Syntax.SavePos();
884                                             CFX_ByteString strWord = m_Syntax.GetKeyword();
885                                             if (!strWord.Compare(FX_BSTRC("startxref"))) {
886                                                 FX_BOOL bNumber = FALSE;
887                                                 CFX_ByteString bsOffset = m_Syntax.GetNextWord(bNumber);
888                                                 if (bNumber) {
889                                                     m_LastXRefOffset = FXSYS_atoi(bsOffset);
890                                                 }
891                                             }
892                                             m_Syntax.RestorePos(dwSavePos);
893                                         }
894                                     } else {
895                                         pObj->Release();
896                                     }
897                                     bInUpdate = TRUE;
898                                 }
899                             }
900                         }
901                         --i;
902                         status = 0;
903                     } else if (byte == "trailer"[inside_index]) {
904                         inside_index ++;
905                     } else {
906                         --i;
907                         status = 0;
908                     }
909                     break;
910                 case 8:
911                     if (inside_index == 4) {
912                         last_xref = pos + i - 4;
913                         status = 1;
914                     } else if (byte == "xref"[inside_index]) {
915                         inside_index ++;
916                     } else {
917                         --i;
918                         status = 0;
919                     }
920                     break;
921                 case 9:
922                     if (byte == '\r' || byte == '\n') {
923                         status = 0;
924                     }
925                     break;
926                 case 10:
927                     if (byte == ')') {
928                         if (depth > 0) {
929                             depth--;
930                         }
931                     } else if (byte == '(') {
932                         depth++;
933                     }
934                     if (!depth) {
935                         status = 0;
936                     }
937                     break;
938                 case 11:
939                     if (byte == '<' && inside_index == 1) {
940                         status = 12;
941                     } else if (byte == '>') {
942                         status = 0;
943                     }
944                     inside_index = 0;
945                     break;
946                 case 12:
947                     --i;
948                     status = 0;
949                     break;
950                 case 13:
951                     if (PDF_CharType[byte] == 'D' || PDF_CharType[byte] == 'W') {
952                         --i;
953                         status = 0;
954                     }
955                     break;
956                 case 14:
957                     if (PDF_CharType[byte] == 'W') {
958                         status = 0;
959                     } else if (byte == '%' || byte == '(' || byte == '<' || byte == '\\') {
960                         status = 0;
961                         --i;
962                     } else if (inside_index == 6) {
963                         status = 0;
964                         --i;
965                     } else if (byte == "endobj"[inside_index]) {
966                         inside_index++;
967                     }
968                     break;
969             }
970             if (bOverFlow) {
971                 size = 0;
972                 break;
973             }
974         }
975         pos += size;
976     }
977     if (last_xref != -1 && last_xref > last_obj) {
978         last_trailer = last_xref;
979     } else if (last_trailer == -1 || last_xref < last_obj) {
980         last_trailer = m_Syntax.m_FileLen;
981     }
982     FX_FILESIZE offset = last_trailer - m_Syntax.m_HeaderOffset;
983     FX_LPVOID pResult = FXSYS_bsearch(&offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
984     if (pResult == NULL) {
985         m_SortedOffset.Add(offset);
986     }
987     FX_Free(buffer);
988     return TRUE;
989 }
990 static FX_DWORD _GetVarInt(FX_LPCBYTE p, FX_INT32 n)
991 {
992     FX_DWORD result = 0;
993     for (FX_INT32 i = 0; i < n; i ++) {
994         result = result * 256 + p[i];
995     }
996     return result;
997 }
998 FX_BOOL CPDF_Parser::LoadCrossRefV5(FX_FILESIZE pos, FX_FILESIZE& prev, FX_BOOL bMainXRef)
999 {
1000     CPDF_Stream* pStream = (CPDF_Stream*)ParseIndirectObjectAt(m_pDocument, pos, 0, NULL);
1001     if (!pStream) {
1002         return FALSE;
1003     }
1004     if (m_pDocument) {
1005         CPDF_Dictionary * pDict = m_pDocument->GetRoot();
1006         if (!pDict || pDict->GetObjNum() != pStream->m_ObjNum) {
1007             m_pDocument->InsertIndirectObject(pStream->m_ObjNum, pStream);
1008         } else {
1009             if (pStream->GetType() == PDFOBJ_STREAM) {
1010                 pStream->Release();
1011             }
1012             return FALSE;
1013         }
1014     }
1015     if (pStream->GetType() != PDFOBJ_STREAM) {
1016         return FALSE;
1017     }
1018     prev = pStream->GetDict()->GetInteger(FX_BSTRC("Prev"));
1019     FX_INT32 size = pStream->GetDict()->GetInteger(FX_BSTRC("Size"));
1020     if (size < 0) {
1021         pStream->Release();
1022         return FALSE;
1023     }
1024     if (bMainXRef) {
1025         m_pTrailer = (CPDF_Dictionary*)pStream->GetDict()->Clone();
1026         m_CrossRef.SetSize(size);
1027         if (m_V5Type.SetSize(size)) {
1028             FXSYS_memset32(m_V5Type.GetData(), 0, size);
1029         }
1030     } else {
1031         m_Trailers.Add((CPDF_Dictionary*)pStream->GetDict()->Clone());
1032     }
1033     std::vector<std::pair<FX_INT32, FX_INT32> > arrIndex;
1034     CPDF_Array* pArray = pStream->GetDict()->GetArray(FX_BSTRC("Index"));
1035     if (pArray) {
1036         FX_DWORD nPairSize = pArray->GetCount() / 2;
1037         for (FX_DWORD i = 0; i < nPairSize; i++) {
1038             CPDF_Object* pStartNumObj = pArray->GetElement(i * 2);
1039             CPDF_Object* pCountObj = pArray->GetElement(i * 2 + 1);
1040             if (pStartNumObj && pStartNumObj->GetType() == PDFOBJ_NUMBER
1041                 && pCountObj && pCountObj->GetType() == PDFOBJ_NUMBER) {
1042                 arrIndex.push_back(std::make_pair(pStartNumObj->GetInteger(), pCountObj->GetInteger()));
1043             }
1044         }
1045     }
1046     if (arrIndex.size() == 0) {
1047         arrIndex.push_back(std::make_pair(0, size));
1048     }
1049     pArray = pStream->GetDict()->GetArray(FX_BSTRC("W"));
1050     if (pArray == NULL) {
1051         pStream->Release();
1052         return FALSE;
1053     }
1054     CFX_DWordArray WidthArray;
1055     FX_SAFE_DWORD dwAccWidth = 0;
1056     for (FX_DWORD i = 0; i < pArray->GetCount(); i ++) {
1057         WidthArray.Add(pArray->GetInteger(i));
1058         dwAccWidth += WidthArray[i];
1059     }
1060     if (!dwAccWidth.IsValid() || WidthArray.GetSize() < 3) {
1061         pStream->Release();
1062         return FALSE;
1063     }
1064     FX_DWORD totalWidth = dwAccWidth.ValueOrDie();
1065     CPDF_StreamAcc acc;
1066     acc.LoadAllData(pStream);
1067     FX_LPCBYTE pData = acc.GetData();
1068     FX_DWORD dwTotalSize = acc.GetSize();
1069     FX_DWORD segindex = 0;
1070     for (FX_DWORD i = 0; i < arrIndex.size(); i ++) {
1071         FX_INT32 startnum = arrIndex[i].first;
1072         if (startnum < 0) {
1073             continue;
1074         }
1075         m_dwXrefStartObjNum = pdfium::base::checked_cast<FX_DWORD, FX_INT32> (startnum);
1076         FX_DWORD count = pdfium::base::checked_cast<FX_DWORD, FX_INT32> (arrIndex[i].second);
1077         FX_SAFE_DWORD dwCaculatedSize = segindex;
1078         dwCaculatedSize += count;
1079         dwCaculatedSize *= totalWidth;
1080         if (!dwCaculatedSize.IsValid() || dwCaculatedSize.ValueOrDie() > dwTotalSize) { 
1081             continue;
1082         }
1083         FX_LPCBYTE segstart = pData + segindex * totalWidth;
1084         FX_SAFE_DWORD dwMaxObjNum = startnum;
1085         dwMaxObjNum += count;
1086         FX_DWORD dwV5Size = pdfium::base::checked_cast<FX_DWORD, FX_INT32> (m_V5Type.GetSize());
1087         if (!dwMaxObjNum.IsValid() || dwMaxObjNum.ValueOrDie() > dwV5Size) {
1088             continue;
1089         }
1090         for (FX_DWORD j = 0; j < count; j ++) {
1091             FX_INT32 type = 1;
1092             FX_LPCBYTE entrystart = segstart + j * totalWidth;
1093             if (WidthArray[0]) {
1094                 type = _GetVarInt(entrystart, WidthArray[0]);
1095             }
1096             if (m_V5Type[startnum + j] == 255) {
1097                 FX_FILESIZE offset = _GetVarInt(entrystart + WidthArray[0], WidthArray[1]);
1098                 m_CrossRef[startnum + j] = offset;
1099                 FX_LPVOID pResult = FXSYS_bsearch(&offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1100                 if (pResult == NULL) {
1101                     m_SortedOffset.Add(offset);
1102                 }
1103                 continue;
1104             }
1105             if (m_V5Type[startnum + j]) {
1106                 continue;
1107             }
1108             m_V5Type[startnum + j] = type;
1109             if (type == 0) {
1110                 m_CrossRef[startnum + j] = 0;
1111             } else {
1112                 FX_FILESIZE offset = _GetVarInt(entrystart + WidthArray[0], WidthArray[1]);
1113                 m_CrossRef[startnum + j] = offset;
1114                 if (type == 1) {
1115                     FX_LPVOID pResult = FXSYS_bsearch(&offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1116                     if (pResult == NULL) {
1117                         m_SortedOffset.Add(offset);
1118                     }
1119                 } else {
1120                     if (offset < 0 || offset >= m_V5Type.GetSize()) {
1121                         pStream->Release();
1122                         return FALSE;
1123                     }
1124                     m_V5Type[offset] = 255;
1125                 }
1126             }
1127         }
1128         segindex += count;
1129     }
1130     pStream->Release();
1131     return TRUE;
1132 }
1133 CPDF_Array* CPDF_Parser::GetIDArray()
1134 {
1135     CPDF_Object* pID = m_pTrailer ? m_pTrailer->GetElement(FX_BSTRC("ID")) : NULL;
1136     if (pID == NULL) {
1137         return NULL;
1138     }
1139     if (pID->GetType() == PDFOBJ_REFERENCE) {
1140         pID = ParseIndirectObject(NULL, ((CPDF_Reference*)pID)->GetRefObjNum());
1141         m_pTrailer->SetAt(FX_BSTRC("ID"), pID);
1142     }
1143     if (pID == NULL || pID->GetType() != PDFOBJ_ARRAY) {
1144         return NULL;
1145     }
1146     return (CPDF_Array*)pID;
1147 }
1148 FX_DWORD CPDF_Parser::GetRootObjNum()
1149 {
1150     CPDF_Object* pRef = m_pTrailer ? m_pTrailer->GetElement(FX_BSTRC("Root")) : NULL;
1151     if (pRef == NULL || pRef->GetType() != PDFOBJ_REFERENCE) {
1152         return 0;
1153     }
1154     return ((CPDF_Reference*) pRef)->GetRefObjNum();
1155 }
1156 FX_DWORD CPDF_Parser::GetInfoObjNum()
1157 {
1158     CPDF_Object* pRef = m_pTrailer ? m_pTrailer->GetElement(FX_BSTRC("Info")) : NULL;
1159     if (pRef == NULL || pRef->GetType() != PDFOBJ_REFERENCE) {
1160         return 0;
1161     }
1162     return ((CPDF_Reference*) pRef)->GetRefObjNum();
1163 }
1164 FX_BOOL CPDF_Parser::IsFormStream(FX_DWORD objnum, FX_BOOL& bForm)
1165 {
1166     bForm = FALSE;
1167     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
1168         return TRUE;
1169     }
1170     if (m_V5Type[objnum] == 0) {
1171         return TRUE;
1172     }
1173     if (m_V5Type[objnum] == 2) {
1174         return TRUE;
1175     }
1176     FX_FILESIZE pos = m_CrossRef[objnum];
1177     FX_LPVOID pResult = FXSYS_bsearch(&pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1178     if (pResult == NULL) {
1179         return TRUE;
1180     }
1181     if ((FX_FILESIZE*)pResult - (FX_FILESIZE*)m_SortedOffset.GetData() == m_SortedOffset.GetSize() - 1) {
1182         return FALSE;
1183     }
1184     FX_FILESIZE size = ((FX_FILESIZE*)pResult)[1] - pos;
1185     FX_FILESIZE SavedPos = m_Syntax.SavePos();
1186     m_Syntax.RestorePos(pos);
1187     bForm = m_Syntax.SearchMultiWord(FX_BSTRC("/Form\0stream"), TRUE, size) == 0;
1188     m_Syntax.RestorePos(SavedPos);
1189     return TRUE;
1190 }
1191 CPDF_Object* CPDF_Parser::ParseIndirectObject(CPDF_IndirectObjects* pObjList, FX_DWORD objnum, PARSE_CONTEXT* pContext)
1192 {
1193     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
1194         return NULL;
1195     }
1196     if (m_V5Type[objnum] == 1 || m_V5Type[objnum] == 255) {
1197         FX_FILESIZE pos = m_CrossRef[objnum];
1198         if (pos <= 0) {
1199             return NULL;
1200         }
1201         return ParseIndirectObjectAt(pObjList, pos, objnum, pContext);
1202     }
1203     if (m_V5Type[objnum] == 2) {
1204         CPDF_StreamAcc* pObjStream = GetObjectStream((FX_DWORD)m_CrossRef[objnum]);
1205         if (pObjStream == NULL) {
1206             return NULL;
1207         }
1208         FX_INT32 n = pObjStream->GetDict()->GetInteger(FX_BSTRC("N"));
1209         FX_INT32 offset = pObjStream->GetDict()->GetInteger(FX_BSTRC("First"));
1210         CPDF_SyntaxParser syntax;
1211         CFX_SmartPointer<IFX_FileStream> file(FX_CreateMemoryStream((FX_LPBYTE)pObjStream->GetData(), (size_t)pObjStream->GetSize(), FALSE));
1212         syntax.InitParser(file.Get(), 0);
1213         CPDF_Object* pRet = NULL;
1214         while (n) {
1215             FX_DWORD thisnum = syntax.GetDirectNum();
1216             FX_DWORD thisoff = syntax.GetDirectNum();
1217             if (thisnum == objnum) {
1218                 syntax.RestorePos(offset + thisoff);
1219                 pRet = syntax.GetObject(pObjList, 0, 0, pContext);
1220                 break;
1221             }
1222             n --;
1223         }
1224         return pRet;
1225     }
1226     return NULL;
1227 }
1228 CPDF_StreamAcc* CPDF_Parser::GetObjectStream(FX_DWORD objnum)
1229 {
1230     CPDF_StreamAcc* pStreamAcc = NULL;
1231     if (m_ObjectStreamMap.Lookup((void*)(FX_UINTPTR)objnum, (void*&)pStreamAcc)) {
1232         return pStreamAcc;
1233     }
1234     const CPDF_Stream* pStream = m_pDocument ? (CPDF_Stream*)m_pDocument->GetIndirectObject(objnum) : NULL;
1235     if (pStream == NULL || pStream->GetType() != PDFOBJ_STREAM) {
1236         return NULL;
1237     }
1238     pStreamAcc = FX_NEW CPDF_StreamAcc;
1239     pStreamAcc->LoadAllData(pStream);
1240     m_ObjectStreamMap.SetAt((void*)(FX_UINTPTR)objnum, pStreamAcc);
1241     return pStreamAcc;
1242 }
1243 FX_FILESIZE CPDF_Parser::GetObjectSize(FX_DWORD objnum)
1244 {
1245     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
1246         return 0;
1247     }
1248     if (m_V5Type[objnum] == 2) {
1249         objnum = (FX_DWORD)m_CrossRef[objnum];
1250     }
1251     if (m_V5Type[objnum] == 1 || m_V5Type[objnum] == 255) {
1252         FX_FILESIZE offset = m_CrossRef[objnum];
1253         if (offset == 0) {
1254             return 0;
1255         }
1256         FX_LPVOID pResult = FXSYS_bsearch(&offset, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1257         if (pResult == NULL) {
1258             return 0;
1259         }
1260         if ((FX_FILESIZE*)pResult - (FX_FILESIZE*)m_SortedOffset.GetData() == m_SortedOffset.GetSize() - 1) {
1261             return 0;
1262         }
1263         return ((FX_FILESIZE*)pResult)[1] - offset;
1264     }
1265     return 0;
1266 }
1267 void CPDF_Parser::GetIndirectBinary(FX_DWORD objnum, FX_LPBYTE& pBuffer, FX_DWORD& size)
1268 {
1269     pBuffer = NULL;
1270     size = 0;
1271     if (objnum >= (FX_DWORD)m_CrossRef.GetSize()) {
1272         return;
1273     }
1274     if (m_V5Type[objnum] == 2) {
1275         CPDF_StreamAcc* pObjStream = GetObjectStream((FX_DWORD)m_CrossRef[objnum]);
1276         if (pObjStream == NULL) {
1277             return;
1278         }
1279         FX_INT32 n = pObjStream->GetDict()->GetInteger(FX_BSTRC("N"));
1280         FX_INT32 offset = pObjStream->GetDict()->GetInteger(FX_BSTRC("First"));
1281         CPDF_SyntaxParser syntax;
1282         FX_LPCBYTE pData = pObjStream->GetData();
1283         FX_DWORD totalsize = pObjStream->GetSize();
1284         CFX_SmartPointer<IFX_FileStream> file(FX_CreateMemoryStream((FX_LPBYTE)pData, (size_t)totalsize, FALSE));
1285         syntax.InitParser(file.Get(), 0);
1286         while (n) {
1287             FX_DWORD thisnum = syntax.GetDirectNum();
1288             FX_DWORD thisoff = syntax.GetDirectNum();
1289             if (thisnum == objnum) {
1290                 if (n == 1) {
1291                     size = totalsize - (thisoff + offset);
1292                 } else {
1293                     syntax.GetDirectNum();  // Skip nextnum.
1294                     FX_DWORD nextoff = syntax.GetDirectNum();
1295                     size = nextoff - thisoff;
1296                 }
1297                 pBuffer = FX_Alloc(FX_BYTE, size);
1298                 FXSYS_memcpy32(pBuffer, pData + thisoff + offset, size);
1299                 return;
1300             }
1301             n --;
1302         }
1303         return;
1304     }
1305     if (m_V5Type[objnum] == 1) {
1306         FX_FILESIZE pos = m_CrossRef[objnum];
1307         if (pos == 0) {
1308             return;
1309         }
1310         FX_FILESIZE SavedPos = m_Syntax.SavePos();
1311         m_Syntax.RestorePos(pos);
1312         FX_BOOL bIsNumber;
1313         CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
1314         if (!bIsNumber) {
1315             m_Syntax.RestorePos(SavedPos);
1316             return;
1317         }
1318         FX_DWORD parser_objnum = FXSYS_atoi(word);
1319         if (parser_objnum && parser_objnum != objnum) {
1320             m_Syntax.RestorePos(SavedPos);
1321             return;
1322         }
1323         word = m_Syntax.GetNextWord(bIsNumber);
1324         if (!bIsNumber) {
1325             m_Syntax.RestorePos(SavedPos);
1326             return;
1327         }
1328         if (m_Syntax.GetKeyword() != FX_BSTRC("obj")) {
1329             m_Syntax.RestorePos(SavedPos);
1330             return;
1331         }
1332         FX_LPVOID pResult = FXSYS_bsearch(&pos, m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1333         if (pResult == NULL) {
1334             m_Syntax.RestorePos(SavedPos);
1335             return;
1336         }
1337         FX_FILESIZE nextoff = ((FX_FILESIZE*)pResult)[1];
1338         FX_BOOL bNextOffValid = FALSE;
1339         if (nextoff != pos) {
1340             m_Syntax.RestorePos(nextoff);
1341             word = m_Syntax.GetNextWord(bIsNumber);
1342             if (word == FX_BSTRC("xref")) {
1343                 bNextOffValid = TRUE;
1344             } else if (bIsNumber) {
1345                 word = m_Syntax.GetNextWord(bIsNumber);
1346                 if (bIsNumber && m_Syntax.GetKeyword() == FX_BSTRC("obj")) {
1347                     bNextOffValid = TRUE;
1348                 }
1349             }
1350         }
1351         if (!bNextOffValid) {
1352             m_Syntax.RestorePos(pos);
1353             while (1) {
1354                 if (m_Syntax.GetKeyword() == FX_BSTRC("endobj")) {
1355                     break;
1356                 }
1357                 if (m_Syntax.SavePos() == m_Syntax.m_FileLen) {
1358                     break;
1359                 }
1360             }
1361             nextoff = m_Syntax.SavePos();
1362         }
1363         size = (FX_DWORD)(nextoff - pos);
1364         pBuffer = FX_Alloc(FX_BYTE, size);
1365         m_Syntax.RestorePos(pos);
1366         m_Syntax.ReadBlock(pBuffer, size);
1367         m_Syntax.RestorePos(SavedPos);
1368     }
1369 }
1370 CPDF_Object* CPDF_Parser::ParseIndirectObjectAt(CPDF_IndirectObjects* pObjList, FX_FILESIZE pos, FX_DWORD objnum,
1371         PARSE_CONTEXT* pContext)
1372 {
1373     FX_FILESIZE SavedPos = m_Syntax.SavePos();
1374     m_Syntax.RestorePos(pos);
1375     FX_BOOL bIsNumber;
1376     CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
1377     if (!bIsNumber) {
1378         m_Syntax.RestorePos(SavedPos);
1379         return NULL;
1380     }
1381     FX_FILESIZE objOffset = m_Syntax.SavePos();
1382     objOffset -= word.GetLength();
1383     FX_DWORD parser_objnum = FXSYS_atoi(word);
1384     if (objnum && parser_objnum != objnum) {
1385         m_Syntax.RestorePos(SavedPos);
1386         return NULL;
1387     }
1388     word = m_Syntax.GetNextWord(bIsNumber);
1389     if (!bIsNumber) {
1390         m_Syntax.RestorePos(SavedPos);
1391         return NULL;
1392     }
1393     FX_DWORD parser_gennum = FXSYS_atoi(word);
1394     if (m_Syntax.GetKeyword() != FX_BSTRC("obj")) {
1395         m_Syntax.RestorePos(SavedPos);
1396         return NULL;
1397     }
1398     CPDF_Object* pObj = m_Syntax.GetObject(pObjList, objnum, parser_gennum, pContext);
1399     FX_FILESIZE endOffset = m_Syntax.SavePos();
1400     CFX_ByteString bsWord = m_Syntax.GetKeyword();
1401     if (bsWord == FX_BSTRC("endobj")) {
1402         endOffset = m_Syntax.SavePos();
1403     }
1404     m_Syntax.RestorePos(SavedPos);
1405     if (pObj) {
1406         if (!objnum) {
1407             pObj->m_ObjNum = parser_objnum;
1408         }
1409         pObj->m_GenNum = parser_gennum;
1410     }
1411     return pObj;
1412 }
1413 CPDF_Object* CPDF_Parser::ParseIndirectObjectAtByStrict(CPDF_IndirectObjects* pObjList, FX_FILESIZE pos, FX_DWORD objnum,
1414         struct PARSE_CONTEXT* pContext, FX_FILESIZE *pResultPos)
1415 {
1416     FX_FILESIZE SavedPos = m_Syntax.SavePos();
1417     m_Syntax.RestorePos(pos);
1418     FX_BOOL bIsNumber;
1419     CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
1420     if (!bIsNumber) {
1421         m_Syntax.RestorePos(SavedPos);
1422         return NULL;
1423     }
1424     FX_DWORD parser_objnum = FXSYS_atoi(word);
1425     if (objnum && parser_objnum != objnum) {
1426         m_Syntax.RestorePos(SavedPos);
1427         return NULL;
1428     }
1429     word = m_Syntax.GetNextWord(bIsNumber);
1430     if (!bIsNumber) {
1431         m_Syntax.RestorePos(SavedPos);
1432         return NULL;
1433     }
1434     FX_DWORD gennum = FXSYS_atoi(word);
1435     if (m_Syntax.GetKeyword() != FX_BSTRC("obj")) {
1436         m_Syntax.RestorePos(SavedPos);
1437         return NULL;
1438     }
1439     CPDF_Object* pObj = m_Syntax.GetObjectByStrict(pObjList, objnum, gennum, pContext);
1440     if (pResultPos) {
1441         *pResultPos = m_Syntax.m_Pos;
1442     }
1443     m_Syntax.RestorePos(SavedPos);
1444     return pObj;
1445 }
1446 CPDF_Dictionary* CPDF_Parser::LoadTrailerV4()
1447 {
1448     if (m_Syntax.GetKeyword() != FX_BSTRC("trailer")) {
1449         return NULL;
1450     }
1451     CPDF_Object* pObj = m_Syntax.GetObject(m_pDocument, 0, 0, 0);
1452     if (pObj == NULL || pObj->GetType() != PDFOBJ_DICTIONARY) {
1453         if (pObj) {
1454             pObj->Release();
1455         }
1456         return NULL;
1457     }
1458     return (CPDF_Dictionary*)pObj;
1459 }
1460 FX_DWORD CPDF_Parser::GetPermissions(FX_BOOL bCheckRevision)
1461 {
1462     if (m_pSecurityHandler == NULL) {
1463         return (FX_DWORD) - 1;
1464     }
1465     FX_DWORD dwPermission = m_pSecurityHandler->GetPermissions();
1466     if (m_pEncryptDict && m_pEncryptDict->GetString(FX_BSTRC("Filter")) == FX_BSTRC("Standard")) {
1467         dwPermission &= 0xFFFFFFFC;
1468         dwPermission |= 0xFFFFF0C0;
1469         if(bCheckRevision && m_pEncryptDict->GetInteger(FX_BSTRC("R")) == 2) {
1470             dwPermission &= 0xFFFFF0FF;
1471         }
1472     }
1473     return dwPermission;
1474 }
1475 FX_BOOL CPDF_Parser::IsOwner()
1476 {
1477     return m_pSecurityHandler == NULL ? TRUE : m_pSecurityHandler->IsOwner();
1478 }
1479 void CPDF_Parser::SetSecurityHandler(CPDF_SecurityHandler* pSecurityHandler, FX_BOOL bForced)
1480 {
1481     ASSERT(m_pSecurityHandler == NULL);
1482     if (m_pSecurityHandler && !m_bForceUseSecurityHandler) {
1483         delete m_pSecurityHandler;
1484         m_pSecurityHandler = NULL;
1485     }
1486     m_bForceUseSecurityHandler = bForced;
1487     m_pSecurityHandler = pSecurityHandler;
1488     if (m_bForceUseSecurityHandler) {
1489         return;
1490     }
1491     m_Syntax.m_pCryptoHandler = pSecurityHandler->CreateCryptoHandler();
1492     m_Syntax.m_pCryptoHandler->Init(NULL, pSecurityHandler);
1493 }
1494 FX_BOOL CPDF_Parser::IsLinearizedFile(IFX_FileRead* pFileAccess, FX_DWORD offset)
1495 {
1496     m_Syntax.InitParser(pFileAccess, offset);
1497     m_Syntax.RestorePos(m_Syntax.m_HeaderOffset + 9);
1498     FX_FILESIZE SavedPos = m_Syntax.SavePos();
1499     FX_BOOL bIsNumber;
1500     CFX_ByteString word = m_Syntax.GetNextWord(bIsNumber);
1501     if (!bIsNumber) {
1502         return FALSE;
1503     }
1504     FX_DWORD objnum = FXSYS_atoi(word);
1505     word = m_Syntax.GetNextWord(bIsNumber);
1506     if (!bIsNumber) {
1507         return FALSE;
1508     }
1509     FX_DWORD gennum = FXSYS_atoi(word);
1510     if (m_Syntax.GetKeyword() != FX_BSTRC("obj")) {
1511         m_Syntax.RestorePos(SavedPos);
1512         return FALSE;
1513     }
1514     m_pLinearized = m_Syntax.GetObject(NULL, objnum, gennum, 0);
1515     if (!m_pLinearized) {
1516         return FALSE;
1517     }
1518     if (m_pLinearized->GetDict() && m_pLinearized->GetDict()->GetElement(FX_BSTRC("Linearized"))) {
1519         m_Syntax.GetNextWord(bIsNumber);
1520         CPDF_Object *pLen = m_pLinearized->GetDict()->GetElement(FX_BSTRC("L"));
1521         if (!pLen) {
1522             m_pLinearized->Release();
1523             m_pLinearized = NULL;
1524             return FALSE;
1525         }
1526         if (pLen->GetInteger() != (int)pFileAccess->GetSize()) {
1527             return FALSE;
1528         }
1529         CPDF_Object *pNo = m_pLinearized->GetDict()->GetElement(FX_BSTRC("P"));
1530         if (pNo && pNo->GetType() == PDFOBJ_NUMBER) {
1531             m_dwFirstPageNo = pNo->GetInteger();
1532         }
1533         CPDF_Object *pTable = m_pLinearized->GetDict()->GetElement(FX_BSTRC("T"));
1534         if (pTable && pTable->GetType() == PDFOBJ_NUMBER) {
1535             m_LastXRefOffset = pTable->GetInteger();
1536         }
1537         return TRUE;
1538     }
1539     m_pLinearized->Release();
1540     m_pLinearized = NULL;
1541     return FALSE;
1542 }
1543 FX_DWORD CPDF_Parser::StartAsynParse(IFX_FileRead* pFileAccess, FX_BOOL bReParse, FX_BOOL bOwnFileRead)
1544 {
1545     CloseParser(bReParse);
1546     m_bXRefStream = FALSE;
1547     m_LastXRefOffset = 0;
1548     m_bOwnFileRead = bOwnFileRead;
1549     FX_INT32 offset = GetHeaderOffset(pFileAccess);
1550     if (offset == -1) {
1551         return PDFPARSE_ERROR_FORMAT;
1552     }
1553     if (!IsLinearizedFile(pFileAccess, offset)) {
1554         m_Syntax.m_pFileAccess = NULL;
1555         return StartParse(pFileAccess, bReParse, bOwnFileRead);
1556     }
1557     if (!bReParse) {
1558         m_pDocument = FX_NEW CPDF_Document(this);
1559     }
1560     FX_FILESIZE dwFirstXRefOffset = m_Syntax.SavePos();
1561     FX_BOOL bXRefRebuilt = FALSE;
1562     FX_BOOL bLoadV4 = FALSE;
1563     if (!(bLoadV4 = LoadCrossRefV4(dwFirstXRefOffset, 0, FALSE, FALSE)) && !LoadCrossRefV5(dwFirstXRefOffset, dwFirstXRefOffset, TRUE)) {
1564         if (!RebuildCrossRef()) {
1565             return PDFPARSE_ERROR_FORMAT;
1566         }
1567         bXRefRebuilt = TRUE;
1568         m_LastXRefOffset = 0;
1569     }
1570     if (bLoadV4) {
1571         m_pTrailer = LoadTrailerV4();
1572         if (m_pTrailer == NULL) {
1573             return FALSE;
1574         }
1575         FX_INT32 xrefsize = GetDirectInteger(m_pTrailer, FX_BSTRC("Size"));
1576         if (xrefsize > 0) {
1577             m_CrossRef.SetSize(xrefsize);
1578             m_V5Type.SetSize(xrefsize);
1579         }
1580     }
1581     FX_DWORD dwRet = SetEncryptHandler();
1582     if (dwRet != PDFPARSE_ERROR_SUCCESS) {
1583         return dwRet;
1584     }
1585     m_pDocument->LoadAsynDoc(m_pLinearized->GetDict());
1586     if (m_pDocument->GetRoot() == NULL || m_pDocument->GetPageCount() == 0) {
1587         if (bXRefRebuilt) {
1588             return PDFPARSE_ERROR_FORMAT;
1589         }
1590         ReleaseEncryptHandler();
1591         if (!RebuildCrossRef()) {
1592             return PDFPARSE_ERROR_FORMAT;
1593         }
1594         dwRet = SetEncryptHandler();
1595         if (dwRet != PDFPARSE_ERROR_SUCCESS) {
1596             return dwRet;
1597         }
1598         m_pDocument->LoadAsynDoc(m_pLinearized->GetDict());
1599         if (m_pDocument->GetRoot() == NULL) {
1600             return PDFPARSE_ERROR_FORMAT;
1601         }
1602     }
1603     FXSYS_qsort(m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1604     FX_DWORD RootObjNum = GetRootObjNum();
1605     if (RootObjNum == 0) {
1606         ReleaseEncryptHandler();
1607         RebuildCrossRef();
1608         RootObjNum = GetRootObjNum();
1609         if (RootObjNum == 0) {
1610             return PDFPARSE_ERROR_FORMAT;
1611         }
1612         dwRet = SetEncryptHandler();
1613         if (dwRet != PDFPARSE_ERROR_SUCCESS) {
1614             return dwRet;
1615         }
1616     }
1617     if (m_pSecurityHandler && m_pSecurityHandler->IsMetadataEncrypted()) {
1618         CPDF_Object* pMetadata = m_pDocument->GetRoot()->GetElement(FX_BSTRC("Metadata"));
1619         if (pMetadata && pMetadata->GetType() == PDFOBJ_REFERENCE) {
1620             m_Syntax.m_MetadataObjnum = ((CPDF_Reference*) pMetadata)->GetRefObjNum();
1621         }
1622     }
1623     return PDFPARSE_ERROR_SUCCESS;
1624 }
1625 FX_BOOL CPDF_Parser::LoadLinearizedAllCrossRefV5(FX_FILESIZE xrefpos)
1626 {
1627     if (!LoadCrossRefV5(xrefpos, xrefpos, FALSE)) {
1628         return FALSE;
1629     }
1630     while (xrefpos)
1631         if (!LoadCrossRefV5(xrefpos, xrefpos, FALSE)) {
1632             return FALSE;
1633         }
1634     m_ObjectStreamMap.InitHashTable(101, FALSE);
1635     m_bXRefStream = TRUE;
1636     return TRUE;
1637 }
1638 FX_DWORD CPDF_Parser::LoadLinearizedMainXRefTable()
1639 {
1640     FX_DWORD dwSaveMetadataObjnum = m_Syntax.m_MetadataObjnum;
1641     m_Syntax.m_MetadataObjnum = 0;
1642     if (m_pTrailer) {
1643         m_pTrailer->Release();
1644         m_pTrailer = NULL;
1645     }
1646     m_Syntax.RestorePos(m_LastXRefOffset - m_Syntax.m_HeaderOffset);
1647     FX_BYTE ch = 0;
1648     FX_DWORD dwCount = 0;
1649     m_Syntax.GetNextChar(ch);
1650     FX_INT32 type = PDF_CharType[ch];
1651     while (type == 'W') {
1652         ++dwCount;
1653         if (m_Syntax.m_FileLen >= (FX_FILESIZE)(m_Syntax.SavePos() + m_Syntax.m_HeaderOffset)) {
1654             break;
1655         }
1656         m_Syntax.GetNextChar(ch);
1657         type = PDF_CharType[ch];
1658     }
1659     m_LastXRefOffset += dwCount;
1660     FX_POSITION pos = m_ObjectStreamMap.GetStartPosition();
1661     while (pos) {
1662         FX_LPVOID objnum;
1663         CPDF_StreamAcc* pStream;
1664         m_ObjectStreamMap.GetNextAssoc(pos, objnum, (void*&)pStream);
1665         delete pStream;
1666     }
1667     m_ObjectStreamMap.RemoveAll();
1668     if (!LoadLinearizedAllCrossRefV4(m_LastXRefOffset, m_dwXrefStartObjNum) && !LoadLinearizedAllCrossRefV5(m_LastXRefOffset)) {
1669         m_LastXRefOffset = 0;
1670         m_Syntax.m_MetadataObjnum = dwSaveMetadataObjnum;
1671         return PDFPARSE_ERROR_FORMAT;
1672     }
1673     FXSYS_qsort(m_SortedOffset.GetData(), m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
1674     m_Syntax.m_MetadataObjnum = dwSaveMetadataObjnum;
1675     return PDFPARSE_ERROR_SUCCESS;
1676 }
1677
1678 // static
1679 int CPDF_SyntaxParser::s_CurrentRecursionDepth = 0;
1680
1681 CPDF_SyntaxParser::CPDF_SyntaxParser()
1682 {
1683     m_pFileAccess = NULL;
1684     m_pCryptoHandler = NULL;
1685     m_pFileBuf = NULL;
1686     m_BufSize = CPDF_ModuleMgr::Get()->m_FileBufSize;
1687     m_pFileBuf = NULL;
1688     m_MetadataObjnum = 0;
1689     m_dwWordPos = 0;
1690     m_bFileStream = FALSE;
1691 }
1692 CPDF_SyntaxParser::~CPDF_SyntaxParser()
1693 {
1694     if (m_pFileBuf) {
1695         FX_Free(m_pFileBuf);
1696     }
1697 }
1698 FX_BOOL CPDF_SyntaxParser::GetCharAt(FX_FILESIZE pos, FX_BYTE& ch)
1699 {
1700     FX_FILESIZE save_pos = m_Pos;
1701     m_Pos = pos;
1702     FX_BOOL ret = GetNextChar(ch);
1703     m_Pos = save_pos;
1704     return ret;
1705 }
1706 FX_BOOL CPDF_SyntaxParser::GetNextChar(FX_BYTE& ch)
1707 {
1708     FX_FILESIZE pos = m_Pos + m_HeaderOffset;
1709     if (pos >= m_FileLen) {
1710         return FALSE;
1711     }
1712     if (m_BufOffset >= pos || (FX_FILESIZE)(m_BufOffset + m_BufSize) <= pos) {
1713         FX_FILESIZE read_pos = pos;
1714         FX_DWORD read_size = m_BufSize;
1715         if ((FX_FILESIZE)read_size > m_FileLen) {
1716             read_size = (FX_DWORD)m_FileLen;
1717         }
1718         if ((FX_FILESIZE)(read_pos + read_size) > m_FileLen) {
1719             if (m_FileLen < (FX_FILESIZE)read_size) {
1720                 read_pos = 0;
1721                 read_size = (FX_DWORD)m_FileLen;
1722             } else {
1723                 read_pos = m_FileLen - read_size;
1724             }
1725         }
1726         if (!m_pFileAccess->ReadBlock(m_pFileBuf, read_pos, read_size)) {
1727             return FALSE;
1728         }
1729         m_BufOffset = read_pos;
1730     }
1731     ch = m_pFileBuf[pos - m_BufOffset];
1732     m_Pos ++;
1733     return TRUE;
1734 }
1735 FX_BOOL CPDF_SyntaxParser::GetCharAtBackward(FX_FILESIZE pos, FX_BYTE& ch)
1736 {
1737     pos += m_HeaderOffset;
1738     if (pos >= m_FileLen) {
1739         return FALSE;
1740     }
1741     if (m_BufOffset >= pos || (FX_FILESIZE)(m_BufOffset + m_BufSize) <= pos) {
1742         FX_FILESIZE read_pos;
1743         if (pos < (FX_FILESIZE)m_BufSize) {
1744             read_pos = 0;
1745         } else {
1746             read_pos = pos - m_BufSize + 1;
1747         }
1748         FX_DWORD read_size = m_BufSize;
1749         if ((FX_FILESIZE)(read_pos + read_size) > m_FileLen) {
1750             if (m_FileLen < (FX_FILESIZE)read_size) {
1751                 read_pos = 0;
1752                 read_size = (FX_DWORD)m_FileLen;
1753             } else {
1754                 read_pos = m_FileLen - read_size;
1755             }
1756         }
1757         if (!m_pFileAccess->ReadBlock(m_pFileBuf, read_pos, read_size)) {
1758             return FALSE;
1759         }
1760         m_BufOffset = read_pos;
1761     }
1762     ch = m_pFileBuf[pos - m_BufOffset];
1763     return TRUE;
1764 }
1765 FX_BOOL CPDF_SyntaxParser::ReadBlock(FX_LPBYTE pBuf, FX_DWORD size)
1766 {
1767     if (!m_pFileAccess->ReadBlock(pBuf, m_Pos + m_HeaderOffset, size)) {
1768         return FALSE;
1769     }
1770     m_Pos += size;
1771     return TRUE;
1772 }
1773 #define MAX_WORD_BUFFER 256
1774 void CPDF_SyntaxParser::GetNextWord()
1775 {
1776     m_WordSize = 0;
1777     m_bIsNumber = TRUE;
1778     FX_BYTE ch;
1779     if (!GetNextChar(ch)) {
1780         return;
1781     }
1782     FX_BYTE type = PDF_CharType[ch];
1783     while (1) {
1784         while (type == 'W') {
1785             if (!GetNextChar(ch)) {
1786                 return;
1787             }
1788             type = PDF_CharType[ch];
1789         }
1790         if (ch != '%') {
1791             break;
1792         }
1793         while (1) {
1794             if (!GetNextChar(ch)) {
1795                 return;
1796             }
1797             if (ch == '\r' || ch == '\n') {
1798                 break;
1799             }
1800         }
1801         type = PDF_CharType[ch];
1802     }
1803     if (type == 'D') {
1804         m_bIsNumber = FALSE;
1805         m_WordBuffer[m_WordSize++] = ch;
1806         if (ch == '/') {
1807             while (1) {
1808                 if (!GetNextChar(ch)) {
1809                     return;
1810                 }
1811                 type = PDF_CharType[ch];
1812                 if (type != 'R' && type != 'N') {
1813                     m_Pos --;
1814                     return;
1815                 }
1816                 if (m_WordSize < MAX_WORD_BUFFER) {
1817                     m_WordBuffer[m_WordSize++] = ch;
1818                 }
1819             }
1820         } else if (ch == '<') {
1821             if (!GetNextChar(ch)) {
1822                 return;
1823             }
1824             if (ch == '<') {
1825                 m_WordBuffer[m_WordSize++] = ch;
1826             } else {
1827                 m_Pos --;
1828             }
1829         } else if (ch == '>') {
1830             if (!GetNextChar(ch)) {
1831                 return;
1832             }
1833             if (ch == '>') {
1834                 m_WordBuffer[m_WordSize++] = ch;
1835             } else {
1836                 m_Pos --;
1837             }
1838         }
1839         return;
1840     }
1841     while (1) {
1842         if (m_WordSize < MAX_WORD_BUFFER) {
1843             m_WordBuffer[m_WordSize++] = ch;
1844         }
1845         if (type != 'N') {
1846             m_bIsNumber = FALSE;
1847         }
1848         if (!GetNextChar(ch)) {
1849             return;
1850         }
1851         type = PDF_CharType[ch];
1852         if (type == 'D' || type == 'W') {
1853             m_Pos --;
1854             break;
1855         }
1856     }
1857 }
1858 CFX_ByteString CPDF_SyntaxParser::ReadString()
1859 {
1860     FX_BYTE ch;
1861     if (!GetNextChar(ch)) {
1862         return CFX_ByteString();
1863     }
1864     CFX_ByteTextBuf buf;
1865     FX_INT32 parlevel = 0;
1866     FX_INT32 status = 0, iEscCode = 0;
1867     while (1) {
1868         switch (status) {
1869             case 0:
1870                 if (ch == ')') {
1871                     if (parlevel == 0) {
1872                         return buf.GetByteString();
1873                     }
1874                     parlevel --;
1875                     buf.AppendChar(')');
1876                 } else if (ch == '(') {
1877                     parlevel ++;
1878                     buf.AppendChar('(');
1879                 } else if (ch == '\\') {
1880                     status = 1;
1881                 } else {
1882                     buf.AppendChar(ch);
1883                 }
1884                 break;
1885             case 1:
1886                 if (ch >= '0' && ch <= '7') {
1887                     iEscCode = ch - '0';
1888                     status = 2;
1889                     break;
1890                 }
1891                 if (ch == 'n') {
1892                     buf.AppendChar('\n');
1893                 } else if (ch == 'r') {
1894                     buf.AppendChar('\r');
1895                 } else if (ch == 't') {
1896                     buf.AppendChar('\t');
1897                 } else if (ch == 'b') {
1898                     buf.AppendChar('\b');
1899                 } else if (ch == 'f') {
1900                     buf.AppendChar('\f');
1901                 } else if (ch == '\r') {
1902                     status = 4;
1903                     break;
1904                 } else if (ch == '\n') {
1905                 } else {
1906                     buf.AppendChar(ch);
1907                 }
1908                 status = 0;
1909                 break;
1910             case 2:
1911                 if (ch >= '0' && ch <= '7') {
1912                     iEscCode = iEscCode * 8 + ch - '0';
1913                     status = 3;
1914                 } else {
1915                     buf.AppendChar(iEscCode);
1916                     status = 0;
1917                     continue;
1918                 }
1919                 break;
1920             case 3:
1921                 if (ch >= '0' && ch <= '7') {
1922                     iEscCode = iEscCode * 8 + ch - '0';
1923                     buf.AppendChar(iEscCode);
1924                     status = 0;
1925                 } else {
1926                     buf.AppendChar(iEscCode);
1927                     status = 0;
1928                     continue;
1929                 }
1930                 break;
1931             case 4:
1932                 status = 0;
1933                 if (ch != '\n') {
1934                     continue;
1935                 }
1936                 break;
1937         }
1938         if (!GetNextChar(ch)) {
1939             break;
1940         }
1941     }
1942     GetNextChar(ch);
1943     return buf.GetByteString();
1944 }
1945 CFX_ByteString CPDF_SyntaxParser::ReadHexString()
1946 {
1947     FX_BYTE ch;
1948     if (!GetNextChar(ch)) {
1949         return CFX_ByteString();
1950     }
1951     CFX_BinaryBuf buf;
1952     FX_BOOL bFirst = TRUE;
1953     FX_BYTE code = 0;
1954     while (1) {
1955         if (ch == '>') {
1956             break;
1957         }
1958         if (ch >= '0' && ch <= '9') {
1959             if (bFirst) {
1960                 code = (ch - '0') * 16;
1961             } else {
1962                 code += ch - '0';
1963                 buf.AppendByte((FX_BYTE)code);
1964             }
1965             bFirst = !bFirst;
1966         } else if (ch >= 'A' && ch <= 'F') {
1967             if (bFirst) {
1968                 code = (ch - 'A' + 10) * 16;
1969             } else {
1970                 code += ch - 'A' + 10;
1971                 buf.AppendByte((FX_BYTE)code);
1972             }
1973             bFirst = !bFirst;
1974         } else if (ch >= 'a' && ch <= 'f') {
1975             if (bFirst) {
1976                 code = (ch - 'a' + 10) * 16;
1977             } else {
1978                 code += ch - 'a' + 10;
1979                 buf.AppendByte((FX_BYTE)code);
1980             }
1981             bFirst = !bFirst;
1982         }
1983         if (!GetNextChar(ch)) {
1984             break;
1985         }
1986     }
1987     if (!bFirst) {
1988         buf.AppendByte((FX_BYTE)code);
1989     }
1990     return buf.GetByteString();
1991 }
1992 void CPDF_SyntaxParser::ToNextLine()
1993 {
1994     FX_BYTE ch;
1995     while (1) {
1996         if (!GetNextChar(ch)) {
1997             return;
1998         }
1999         if (ch == '\n') {
2000             return;
2001         }
2002         if (ch == '\r') {
2003             GetNextChar(ch);
2004             if (ch == '\n') {
2005                 return;
2006             } else {
2007                 m_Pos --;
2008                 return;
2009             }
2010         }
2011     }
2012 }
2013 void CPDF_SyntaxParser::ToNextWord()
2014 {
2015     FX_BYTE ch;
2016     if (!GetNextChar(ch)) {
2017         return;
2018     }
2019     FX_BYTE type = PDF_CharType[ch];
2020     while (1) {
2021         while (type == 'W') {
2022             m_dwWordPos = m_Pos;
2023             if (!GetNextChar(ch)) {
2024                 return;
2025             }
2026             type = PDF_CharType[ch];
2027         }
2028         if (ch != '%') {
2029             break;
2030         }
2031         while (1) {
2032             if (!GetNextChar(ch)) {
2033                 return;
2034             }
2035             if (ch == '\r' || ch == '\n') {
2036                 break;
2037             }
2038         }
2039         type = PDF_CharType[ch];
2040     }
2041     m_Pos --;
2042 }
2043 CFX_ByteString CPDF_SyntaxParser::GetNextWord(FX_BOOL& bIsNumber)
2044 {
2045     GetNextWord();
2046     bIsNumber = m_bIsNumber;
2047     return CFX_ByteString((FX_LPCSTR)m_WordBuffer, m_WordSize);
2048 }
2049 CFX_ByteString CPDF_SyntaxParser::GetKeyword()
2050 {
2051     GetNextWord();
2052     return CFX_ByteString((FX_LPCSTR)m_WordBuffer, m_WordSize);
2053 }
2054 CPDF_Object* CPDF_SyntaxParser::GetObject(CPDF_IndirectObjects* pObjList, FX_DWORD objnum, FX_DWORD gennum, PARSE_CONTEXT* pContext, FX_BOOL bDecrypt)
2055 {
2056     CFX_AutoRestorer<int> restorer(&s_CurrentRecursionDepth);
2057     if (++s_CurrentRecursionDepth > kParserMaxRecursionDepth) {
2058         return NULL;
2059     }
2060     FX_FILESIZE SavedPos = m_Pos;
2061     FX_BOOL bTypeOnly = pContext && (pContext->m_Flags & PDFPARSE_TYPEONLY);
2062     FX_BOOL bIsNumber;
2063     CFX_ByteString word = GetNextWord(bIsNumber);
2064     CPDF_Object* pRet = NULL;
2065     if (word.GetLength() == 0) {
2066         if (bTypeOnly) {
2067             return (CPDF_Object*)PDFOBJ_INVALID;
2068         }
2069         return NULL;
2070     }
2071     if (bIsNumber) {
2072         FX_FILESIZE SavedPos = m_Pos;
2073         CFX_ByteString nextword = GetNextWord(bIsNumber);
2074         if (bIsNumber) {
2075             CFX_ByteString nextword2 = GetNextWord(bIsNumber);
2076             if (nextword2 == FX_BSTRC("R")) {
2077                 FX_DWORD objnum = FXSYS_atoi(word);
2078                 if (bTypeOnly) {
2079                     return (CPDF_Object*)PDFOBJ_REFERENCE;
2080                 }
2081                 pRet = CPDF_Reference::Create(pObjList, objnum);
2082                 return pRet;
2083             } else {
2084                 m_Pos = SavedPos;
2085                 if (bTypeOnly) {
2086                     return (CPDF_Object*)PDFOBJ_NUMBER;
2087                 }
2088                 pRet = CPDF_Number::Create(word);
2089                 return pRet;
2090             }
2091         } else {
2092             m_Pos = SavedPos;
2093             if (bTypeOnly) {
2094                 return (CPDF_Object*)PDFOBJ_NUMBER;
2095             }
2096             pRet = CPDF_Number::Create(word);
2097             return pRet;
2098         }
2099     }
2100     if (word == FX_BSTRC("true") || word == FX_BSTRC("false")) {
2101         if (bTypeOnly) {
2102             return (CPDF_Object*)PDFOBJ_BOOLEAN;
2103         }
2104         pRet = CPDF_Boolean::Create(word == FX_BSTRC("true"));
2105         return pRet;
2106     }
2107     if (word == FX_BSTRC("null")) {
2108         if (bTypeOnly) {
2109             return (CPDF_Object*)PDFOBJ_NULL;
2110         }
2111         pRet = CPDF_Null::Create();
2112         return pRet;
2113     }
2114     if (word == FX_BSTRC("(")) {
2115         if (bTypeOnly) {
2116             return (CPDF_Object*)PDFOBJ_STRING;
2117         }
2118         CFX_ByteString str = ReadString();
2119         if (m_pCryptoHandler && bDecrypt) {
2120             m_pCryptoHandler->Decrypt(objnum, gennum, str);
2121         }
2122         pRet = CPDF_String::Create(str, FALSE);
2123         return pRet;
2124     }
2125     if (word == FX_BSTRC("<")) {
2126         if (bTypeOnly) {
2127             return (CPDF_Object*)PDFOBJ_STRING;
2128         }
2129         CFX_ByteString str = ReadHexString();
2130         if (m_pCryptoHandler && bDecrypt) {
2131             m_pCryptoHandler->Decrypt(objnum, gennum, str);
2132         }
2133         pRet = CPDF_String::Create(str, TRUE);
2134         return pRet;
2135     }
2136     if (word == FX_BSTRC("[")) {
2137         if (bTypeOnly) {
2138             return (CPDF_Object*)PDFOBJ_ARRAY;
2139         }
2140         CPDF_Array* pArray = CPDF_Array::Create();
2141         while (1) {
2142             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum);
2143             if (pObj == NULL) {
2144                 return pArray;
2145             }
2146             pArray->Add(pObj);
2147         }
2148     }
2149     if (word[0] == '/') {
2150         if (bTypeOnly) {
2151             return (CPDF_Object*)PDFOBJ_NAME;
2152         }
2153         pRet = CPDF_Name::Create(PDF_NameDecode(CFX_ByteStringC(m_WordBuffer + 1, m_WordSize - 1)));
2154         return pRet;
2155     }
2156     if (word == FX_BSTRC("<<")) {
2157         FX_FILESIZE saveDictOffset = m_Pos - 2;
2158         FX_DWORD dwDictSize = 0;
2159         if (bTypeOnly) {
2160             return (CPDF_Object*)PDFOBJ_DICTIONARY;
2161         }
2162         if (pContext) {
2163             pContext->m_DictStart = SavedPos;
2164         }
2165         CPDF_Dictionary* pDict = CPDF_Dictionary::Create();
2166         FX_INT32 nKeys = 0;
2167         FX_FILESIZE dwSignValuePos = 0;
2168         while (1) {
2169             FX_BOOL bIsNumber;
2170             CFX_ByteString key = GetNextWord(bIsNumber);
2171             if (key.IsEmpty()) {
2172                 if (pDict)
2173                     pDict->Release();
2174                 return NULL;
2175             }
2176             FX_FILESIZE SavedPos = m_Pos - key.GetLength();
2177             if (key == FX_BSTRC(">>")) {
2178                 dwDictSize = m_Pos - saveDictOffset;
2179                 break;
2180             }
2181             if (key == FX_BSTRC("endobj")) {
2182                 dwDictSize = m_Pos - 6 - saveDictOffset;
2183                 m_Pos = SavedPos;
2184                 break;
2185             }
2186             if (key[0] != '/') {
2187                 continue;
2188             }
2189             nKeys ++;
2190             key = PDF_NameDecode(key);
2191             if (key == FX_BSTRC("/Contents")) {
2192                 dwSignValuePos = m_Pos;
2193             }
2194             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum);
2195             if (pObj == NULL) {
2196                 continue;
2197             }
2198             if (key.GetLength() >= 1) {
2199                 if (nKeys < 32) {
2200                     pDict->SetAt(CFX_ByteStringC(key.c_str() + 1, key.GetLength() - 1), pObj);
2201                 } else {
2202                     pDict->AddValue(CFX_ByteStringC(key.c_str() + 1, key.GetLength() - 1), pObj);
2203                 }
2204             }
2205         }
2206         if (IsSignatureDict(pDict)) {
2207             FX_FILESIZE dwSavePos = m_Pos;
2208             m_Pos = dwSignValuePos;
2209             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum, NULL, FALSE);
2210             pDict->SetAt(FX_BSTRC("Contents"), pObj);
2211             m_Pos = dwSavePos;
2212         }
2213         if (pContext) {
2214             pContext->m_DictEnd = m_Pos;
2215             if (pContext->m_Flags & PDFPARSE_NOSTREAM) {
2216                 return pDict;
2217             }
2218         }
2219         FX_FILESIZE SavedPos = m_Pos;
2220         FX_BOOL bIsNumber;
2221         CFX_ByteString nextword = GetNextWord(bIsNumber);
2222         if (nextword == FX_BSTRC("stream")) {
2223             CPDF_Stream* pStream = ReadStream(pDict, pContext, objnum, gennum);
2224             if (pStream) {
2225                 return pStream;
2226             }
2227             if (pDict)
2228                 pDict->Release();
2229             return NULL;
2230         } else {
2231             m_Pos = SavedPos;
2232             return pDict;
2233         }
2234     }
2235     if (word == FX_BSTRC(">>")) {
2236         m_Pos = SavedPos;
2237         return NULL;
2238     }
2239     if (bTypeOnly) {
2240         return (CPDF_Object*)PDFOBJ_INVALID;
2241     }
2242     return NULL;
2243 }
2244 CPDF_Object* CPDF_SyntaxParser::GetObjectByStrict(CPDF_IndirectObjects* pObjList, FX_DWORD objnum, FX_DWORD gennum, struct PARSE_CONTEXT* pContext)
2245 {
2246     CFX_AutoRestorer<int> restorer(&s_CurrentRecursionDepth);
2247     if (++s_CurrentRecursionDepth > kParserMaxRecursionDepth) {
2248         return NULL;
2249     }
2250     FX_FILESIZE SavedPos = m_Pos;
2251     FX_BOOL bTypeOnly = pContext && (pContext->m_Flags & PDFPARSE_TYPEONLY);
2252     FX_BOOL bIsNumber;
2253     CFX_ByteString word = GetNextWord(bIsNumber);
2254     if (word.GetLength() == 0) {
2255         if (bTypeOnly) {
2256             return (CPDF_Object*)PDFOBJ_INVALID;
2257         }
2258         return NULL;
2259     }
2260     if (bIsNumber) {
2261         FX_FILESIZE SavedPos = m_Pos;
2262         CFX_ByteString nextword = GetNextWord(bIsNumber);
2263         if (bIsNumber) {
2264             CFX_ByteString nextword2 = GetNextWord(bIsNumber);
2265             if (nextword2 == FX_BSTRC("R")) {
2266                 FX_DWORD objnum = FXSYS_atoi(word);
2267                 if (bTypeOnly) {
2268                     return (CPDF_Object*)PDFOBJ_REFERENCE;
2269                 }
2270                 return CPDF_Reference::Create(pObjList, objnum);
2271             } else {
2272                 m_Pos = SavedPos;
2273                 if (bTypeOnly) {
2274                     return (CPDF_Object*)PDFOBJ_NUMBER;
2275                 }
2276                 return CPDF_Number::Create(word);
2277             }
2278         } else {
2279             m_Pos = SavedPos;
2280             if (bTypeOnly) {
2281                 return (CPDF_Object*)PDFOBJ_NUMBER;
2282             }
2283             return CPDF_Number::Create(word);
2284         }
2285     }
2286     if (word == FX_BSTRC("true") || word == FX_BSTRC("false")) {
2287         if (bTypeOnly) {
2288             return (CPDF_Object*)PDFOBJ_BOOLEAN;
2289         }
2290         return CPDF_Boolean::Create(word == FX_BSTRC("true"));
2291     }
2292     if (word == FX_BSTRC("null")) {
2293         if (bTypeOnly) {
2294             return (CPDF_Object*)PDFOBJ_NULL;
2295         }
2296         return CPDF_Null::Create();
2297     }
2298     if (word == FX_BSTRC("(")) {
2299         if (bTypeOnly) {
2300             return (CPDF_Object*)PDFOBJ_STRING;
2301         }
2302         CFX_ByteString str = ReadString();
2303         if (m_pCryptoHandler) {
2304             m_pCryptoHandler->Decrypt(objnum, gennum, str);
2305         }
2306         return CPDF_String::Create(str, FALSE);
2307     }
2308     if (word == FX_BSTRC("<")) {
2309         if (bTypeOnly) {
2310             return (CPDF_Object*)PDFOBJ_STRING;
2311         }
2312         CFX_ByteString str = ReadHexString();
2313         if (m_pCryptoHandler) {
2314             m_pCryptoHandler->Decrypt(objnum, gennum, str);
2315         }
2316         return CPDF_String::Create(str, TRUE);
2317     }
2318     if (word == FX_BSTRC("[")) {
2319         if (bTypeOnly) {
2320             return (CPDF_Object*)PDFOBJ_ARRAY;
2321         }
2322         CPDF_Array* pArray = CPDF_Array::Create();
2323         while (1) {
2324             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum);
2325             if (pObj == NULL) {
2326                 if (m_WordBuffer[0] == ']') {
2327                     return pArray;
2328                 }
2329                 if (pArray)
2330                     pArray->Release();
2331                 return NULL;
2332             }
2333             pArray->Add(pObj);
2334         }
2335     }
2336     if (word[0] == '/') {
2337         if (bTypeOnly) {
2338             return (CPDF_Object*)PDFOBJ_NAME;
2339         }
2340         return CPDF_Name::Create(PDF_NameDecode(CFX_ByteStringC(m_WordBuffer + 1, m_WordSize - 1)));
2341     }
2342     if (word == FX_BSTRC("<<")) {
2343         if (bTypeOnly) {
2344             return (CPDF_Object*)PDFOBJ_DICTIONARY;
2345         }
2346         if (pContext) {
2347             pContext->m_DictStart = SavedPos;
2348         }
2349         CPDF_Dictionary* pDict = CPDF_Dictionary::Create();
2350         while (1) {
2351             FX_BOOL bIsNumber;
2352             FX_FILESIZE SavedPos = m_Pos;
2353             CFX_ByteString key = GetNextWord(bIsNumber);
2354             if (key.IsEmpty()) {
2355                 if (pDict)
2356                     pDict->Release();
2357                 return NULL;
2358             }
2359             if (key == FX_BSTRC(">>")) {
2360                 break;
2361             }
2362             if (key == FX_BSTRC("endobj")) {
2363                 m_Pos = SavedPos;
2364                 break;
2365             }
2366             if (key[0] != '/') {
2367                 continue;
2368             }
2369             key = PDF_NameDecode(key);
2370             CPDF_Object* pObj = GetObject(pObjList, objnum, gennum);
2371             if (pObj == NULL) {
2372                 if (pDict)
2373                     pDict->Release();
2374                 FX_BYTE ch;
2375                 while (1) {
2376                     if (!GetNextChar(ch)) {
2377                         break;
2378                     }
2379                     if (ch == 0x0A || ch == 0x0D) {
2380                         break;
2381                     }
2382                 }
2383                 return NULL;
2384             }
2385             if (key.GetLength() == 1) {
2386                 pDict->SetAt(CFX_ByteStringC(key.c_str() + 1, key.GetLength() - 1), pObj);
2387             } else {
2388                 pDict->AddValue(CFX_ByteStringC(key.c_str() + 1, key.GetLength() - 1), pObj);
2389             }
2390         }
2391         if (pContext) {
2392             pContext->m_DictEnd = m_Pos;
2393             if (pContext->m_Flags & PDFPARSE_NOSTREAM) {
2394                 return pDict;
2395             }
2396         }
2397         FX_FILESIZE SavedPos = m_Pos;
2398         FX_BOOL bIsNumber;
2399         CFX_ByteString nextword = GetNextWord(bIsNumber);
2400         if (nextword == FX_BSTRC("stream")) {
2401             CPDF_Stream* pStream = ReadStream(pDict, pContext, objnum, gennum);
2402             if (pStream) {
2403                 return pStream;
2404             }
2405             if (pDict)
2406                 pDict->Release();
2407             return NULL;
2408         } else {
2409             m_Pos = SavedPos;
2410             return pDict;
2411         }
2412     }
2413     if (word == FX_BSTRC(">>")) {
2414         m_Pos = SavedPos;
2415         return NULL;
2416     }
2417     if (bTypeOnly) {
2418         return (CPDF_Object*)PDFOBJ_INVALID;
2419     }
2420     return NULL;
2421 }
2422 CPDF_Stream* CPDF_SyntaxParser::ReadStream(CPDF_Dictionary* pDict, PARSE_CONTEXT* pContext,
2423         FX_DWORD objnum, FX_DWORD gennum)
2424 {
2425     CPDF_Object* pLenObj = pDict->GetElement(FX_BSTRC("Length"));
2426     FX_FILESIZE len = 0;
2427     if (pLenObj && ((pLenObj->GetType() != PDFOBJ_REFERENCE) ||
2428                     ((((CPDF_Reference*)pLenObj)->GetObjList() != NULL) &&
2429                      ((CPDF_Reference*)pLenObj)->GetRefObjNum() != objnum))) {
2430         len = pLenObj->GetInteger();
2431     }
2432
2433     ToNextLine();
2434     FX_FILESIZE StreamStartPos = m_Pos;
2435     if (pContext) {
2436         pContext->m_DataStart = m_Pos;
2437     }
2438
2439     CPDF_CryptoHandler* pCryptoHandler = objnum == (FX_DWORD)m_MetadataObjnum ? NULL : m_pCryptoHandler;
2440     if (pCryptoHandler == NULL) {
2441         pdfium::base::CheckedNumeric<FX_FILESIZE> pos = m_Pos;
2442         pos += len;
2443         if (pos.IsValid() && pos.ValueOrDie() < m_FileLen) {
2444             m_Pos = pos.ValueOrDie();
2445         }
2446         GetNextWord();
2447         if (m_WordSize < 9 || FXSYS_memcmp32(m_WordBuffer, "endstream", 9)) {
2448             m_Pos = StreamStartPos;
2449             FX_FILESIZE offset = FindTag(FX_BSTRC("endstream"), 0);
2450             if (offset >= 0) {
2451                 FX_FILESIZE curPos = m_Pos;
2452                 m_Pos = StreamStartPos;
2453                 FX_FILESIZE endobjOffset = FindTag(FX_BSTRC("endobj"), 0);
2454                 if (endobjOffset < offset && endobjOffset >= 0) {
2455                     offset = endobjOffset;
2456                 } else {
2457                     m_Pos = curPos;
2458                 }
2459                 FX_BYTE byte1, byte2;
2460                 GetCharAt(StreamStartPos + offset - 1, byte1);
2461                 GetCharAt(StreamStartPos + offset - 2, byte2);
2462                 if (byte1 == 0x0a && byte2 == 0x0d) {
2463                     len -= 2;
2464                 } else if (byte1 == 0x0a || byte1 == 0x0d) {
2465                     len --;
2466                 }
2467                 len = (FX_DWORD)offset;
2468                 pDict->SetAtInteger(FX_BSTRC("Length"), len);
2469             } else {
2470                 m_Pos = StreamStartPos;
2471                 if (FindTag(FX_BSTRC("endobj"), 0) < 0) {
2472                     return NULL;
2473                 }
2474             }
2475         }
2476         m_Pos = StreamStartPos;
2477     }
2478     CPDF_Stream* pStream;
2479     FX_LPBYTE pData = FX_Alloc(FX_BYTE, len);
2480     if (!pData) {
2481         return NULL;
2482     }
2483     ReadBlock(pData, len);
2484     if (pCryptoHandler) {
2485         CFX_BinaryBuf dest_buf;
2486         dest_buf.EstimateSize(pCryptoHandler->DecryptGetSize(len));
2487         FX_LPVOID context = pCryptoHandler->DecryptStart(objnum, gennum);
2488         pCryptoHandler->DecryptStream(context, pData, len, dest_buf);
2489         pCryptoHandler->DecryptFinish(context, dest_buf);
2490         FX_Free(pData);
2491         pData = dest_buf.GetBuffer();
2492         len = dest_buf.GetSize();
2493         dest_buf.DetachBuffer();
2494     }
2495     pStream = FX_NEW CPDF_Stream(pData, len, pDict);
2496     if (pContext) {
2497         pContext->m_DataEnd = pContext->m_DataStart + len;
2498     }
2499     StreamStartPos = m_Pos;
2500     GetNextWord();
2501     if (m_WordSize == 6 && 0 == FXSYS_memcmp32(m_WordBuffer, "endobj", 6)) {
2502         m_Pos = StreamStartPos;
2503     }
2504     return pStream;
2505 }
2506 void CPDF_SyntaxParser::InitParser(IFX_FileRead* pFileAccess, FX_DWORD HeaderOffset)
2507 {
2508     if (m_pFileBuf) {
2509         FX_Free(m_pFileBuf);
2510         m_pFileBuf = NULL;
2511     }
2512     m_pFileBuf = FX_Alloc(FX_BYTE, m_BufSize);
2513     m_HeaderOffset = HeaderOffset;
2514     m_FileLen = pFileAccess->GetSize();
2515     m_Pos = 0;
2516     m_pFileAccess = pFileAccess;
2517     m_BufOffset = 0;
2518     pFileAccess->ReadBlock(m_pFileBuf, 0, (size_t)((FX_FILESIZE)m_BufSize > m_FileLen ? m_FileLen : m_BufSize));
2519 }
2520 FX_INT32 CPDF_SyntaxParser::GetDirectNum()
2521 {
2522     GetNextWord();
2523     if (!m_bIsNumber) {
2524         return 0;
2525     }
2526     m_WordBuffer[m_WordSize] = 0;
2527     return FXSYS_atoi((FX_LPCSTR)m_WordBuffer);
2528 }
2529 FX_BOOL CPDF_SyntaxParser::IsWholeWord(FX_FILESIZE startpos, FX_FILESIZE limit, FX_LPCBYTE tag, FX_DWORD taglen)
2530 {
2531     FX_BYTE type = PDF_CharType[tag[0]];
2532     FX_BOOL bCheckLeft = type != 'D' && type != 'W';
2533     type = PDF_CharType[tag[taglen - 1]];
2534     FX_BOOL bCheckRight = type != 'D' && type != 'W';
2535     FX_BYTE ch;
2536     if (bCheckRight && startpos + (FX_INT32)taglen <= limit && GetCharAt(startpos + (FX_INT32)taglen, ch)) {
2537         FX_BYTE type = PDF_CharType[ch];
2538         if (type == 'N' || type == 'R') {
2539             return FALSE;
2540         }
2541     }
2542     if (bCheckLeft && startpos > 0 && GetCharAt(startpos - 1, ch)) {
2543         FX_BYTE type = PDF_CharType[ch];
2544         if (type == 'N' || type == 'R') {
2545             return FALSE;
2546         }
2547     }
2548     return TRUE;
2549 }
2550 FX_BOOL CPDF_SyntaxParser::SearchWord(FX_BSTR tag, FX_BOOL bWholeWord, FX_BOOL bForward, FX_FILESIZE limit)
2551 {
2552     FX_INT32 taglen = tag.GetLength();
2553     if (taglen == 0) {
2554         return FALSE;
2555     }
2556     FX_FILESIZE pos = m_Pos;
2557     FX_INT32 offset = 0;
2558     if (!bForward) {
2559         offset = taglen - 1;
2560     }
2561     FX_LPCBYTE tag_data = tag;
2562     FX_BYTE byte;
2563     while (1) {
2564         if (bForward) {
2565             if (limit) {
2566                 if (pos >= m_Pos + limit) {
2567                     return FALSE;
2568                 }
2569             }
2570             if (!GetCharAt(pos, byte)) {
2571                 return FALSE;
2572             }
2573         } else {
2574             if (limit) {
2575                 if (pos <= m_Pos - limit) {
2576                     return FALSE;
2577                 }
2578             }
2579             if (!GetCharAtBackward(pos, byte)) {
2580                 return FALSE;
2581             }
2582         }
2583         if (byte == tag_data[offset]) {
2584             if (bForward) {
2585                 offset ++;
2586                 if (offset < taglen) {
2587                     pos ++;
2588                     continue;
2589                 }
2590             } else {
2591                 offset --;
2592                 if (offset >= 0) {
2593                     pos --;
2594                     continue;
2595                 }
2596             }
2597             FX_FILESIZE startpos = bForward ? pos - taglen + 1 : pos;
2598             if (!bWholeWord || IsWholeWord(startpos, limit, tag, taglen)) {
2599                 m_Pos = startpos;
2600                 return TRUE;
2601             }
2602         }
2603         if (bForward) {
2604             offset = byte == tag_data[0] ? 1 : 0;
2605             pos ++;
2606         } else {
2607             offset = byte == tag_data[taglen - 1] ? taglen - 2 : taglen - 1;
2608             pos --;
2609         }
2610         if (pos < 0) {
2611             return FALSE;
2612         }
2613     }
2614     return FALSE;
2615 }
2616 struct _SearchTagRecord {
2617     FX_LPCBYTE  m_pTag;
2618     FX_DWORD    m_Len;
2619     FX_DWORD    m_Offset;
2620 };
2621 FX_INT32 CPDF_SyntaxParser::SearchMultiWord(FX_BSTR tags, FX_BOOL bWholeWord, FX_FILESIZE limit)
2622 {
2623     FX_INT32 ntags = 1, i;
2624     for (i = 0; i < tags.GetLength(); i ++)
2625         if (tags[i] == 0) {
2626             ntags ++;
2627         }
2628     _SearchTagRecord* pPatterns = FX_Alloc(_SearchTagRecord, ntags);
2629     FX_DWORD start = 0, itag = 0, max_len = 0;
2630     for (i = 0; i <= tags.GetLength(); i ++) {
2631         if (tags[i] == 0) {
2632             FX_DWORD len = i - start;
2633             if (len > max_len) {
2634                 max_len = len;
2635             }
2636             pPatterns[itag].m_pTag = tags.GetPtr() + start;
2637             pPatterns[itag].m_Len = len;
2638             pPatterns[itag].m_Offset = 0;
2639             start = i + 1;
2640             itag ++;
2641         }
2642     }
2643     FX_FILESIZE pos = m_Pos;
2644     FX_BYTE byte;
2645     GetCharAt(pos++, byte);
2646     FX_INT32 found = -1;
2647     while (1) {
2648         for (i = 0; i < ntags; i ++) {
2649             if (pPatterns[i].m_pTag[pPatterns[i].m_Offset] == byte) {
2650                 pPatterns[i].m_Offset ++;
2651                 if (pPatterns[i].m_Offset == pPatterns[i].m_Len) {
2652                     if (!bWholeWord || IsWholeWord(pos - pPatterns[i].m_Len, limit, pPatterns[i].m_pTag, pPatterns[i].m_Len)) {
2653                         found = i;
2654                         goto end;
2655                     } else {
2656                         if (pPatterns[i].m_pTag[0] == byte) {
2657                             pPatterns[i].m_Offset = 1;
2658                         } else {
2659                             pPatterns[i].m_Offset = 0;
2660                         }
2661                     }
2662                 }
2663             } else {
2664                 if (pPatterns[i].m_pTag[0] == byte) {
2665                     pPatterns[i].m_Offset = 1;
2666                 } else {
2667                     pPatterns[i].m_Offset = 0;
2668                 }
2669             }
2670         }
2671         if (limit && pos >= m_Pos + limit) {
2672             goto end;
2673         }
2674         if (!GetCharAt(pos, byte)) {
2675             goto end;
2676         }
2677         pos ++;
2678     }
2679 end:
2680     FX_Free(pPatterns);
2681     return found;
2682 }
2683 FX_FILESIZE CPDF_SyntaxParser::FindTag(FX_BSTR tag, FX_FILESIZE limit)
2684 {
2685     FX_INT32 taglen = tag.GetLength();
2686     FX_INT32 match = 0;
2687     limit += m_Pos;
2688     FX_FILESIZE startpos = m_Pos;
2689     while (1) {
2690         FX_BYTE ch;
2691         if (!GetNextChar(ch)) {
2692             return -1;
2693         }
2694         if (ch == tag[match]) {
2695             match ++;
2696             if (match == taglen) {
2697                 return m_Pos - startpos - taglen;
2698             }
2699         } else {
2700             match = ch == tag[0] ? 1 : 0;
2701         }
2702         if (limit && m_Pos == limit) {
2703             return -1;
2704         }
2705     }
2706     return -1;
2707 }
2708 void CPDF_SyntaxParser::GetBinary(FX_BYTE* buffer, FX_DWORD size)
2709 {
2710     FX_DWORD offset = 0;
2711     FX_BYTE ch;
2712     while (1) {
2713         if (!GetNextChar(ch)) {
2714             return;
2715         }
2716         buffer[offset++] = ch;
2717         if (offset == size) {
2718             break;
2719         }
2720     }
2721 }
2722
2723 class CPDF_DataAvail FX_FINAL : public CFX_Object, public IPDF_DataAvail
2724 {
2725 public:
2726     CPDF_DataAvail(IFX_FileAvail* pFileAvail, IFX_FileRead* pFileRead);
2727     ~CPDF_DataAvail();
2728
2729     virtual FX_BOOL                     IsDocAvail(IFX_DownloadHints* pHints)  FX_OVERRIDE;
2730
2731     virtual void                        SetDocument(CPDF_Document* pDoc)  FX_OVERRIDE;
2732
2733     virtual FX_BOOL                     IsPageAvail(int iPage, IFX_DownloadHints* pHints)  FX_OVERRIDE;
2734
2735     virtual FX_INT32                    IsFormAvail(IFX_DownloadHints *pHints)  FX_OVERRIDE;
2736
2737     virtual FX_INT32                    IsLinearizedPDF()  FX_OVERRIDE;
2738
2739     virtual FX_BOOL                     IsLinearized()  FX_OVERRIDE
2740     {
2741         return m_bLinearized;
2742     }
2743
2744     virtual void                        GetLinearizedMainXRefInfo(FX_FILESIZE *pPos, FX_DWORD *pSize)  FX_OVERRIDE;
2745
2746 protected:
2747     static const int kMaxDataAvailRecursionDepth = 64;
2748     static int s_CurrentDataAvailRecursionDepth;
2749
2750     FX_DWORD                            GetObjectSize(FX_DWORD objnum, FX_FILESIZE& offset);
2751     FX_BOOL                             IsObjectsAvail(CFX_PtrArray& obj_array, FX_BOOL bParsePage, IFX_DownloadHints* pHints, CFX_PtrArray &ret_array);
2752     FX_BOOL                             CheckDocStatus(IFX_DownloadHints *pHints);
2753     FX_BOOL                             CheckHeader(IFX_DownloadHints* pHints);
2754     FX_BOOL                             CheckFirstPage(IFX_DownloadHints *pHints);
2755     FX_BOOL                             CheckEnd(IFX_DownloadHints *pHints);
2756     FX_BOOL                             CheckCrossRef(IFX_DownloadHints* pHints);
2757     FX_BOOL                             CheckCrossRefItem(IFX_DownloadHints *pHints);
2758     FX_BOOL                             CheckTrailer(IFX_DownloadHints* pHints);
2759     FX_BOOL                             CheckRoot(IFX_DownloadHints* pHints);
2760     FX_BOOL                             CheckInfo(IFX_DownloadHints* pHints);
2761     FX_BOOL                             CheckPages(IFX_DownloadHints* pHints);
2762     FX_BOOL                             CheckPage(IFX_DownloadHints* pHints);
2763     FX_BOOL                             CheckResources(IFX_DownloadHints* pHints);
2764     FX_BOOL                             CheckAnnots(IFX_DownloadHints* pHints);
2765     FX_BOOL                             CheckAcroForm(IFX_DownloadHints* pHints);
2766     FX_BOOL                             CheckAcroFormSubObject(IFX_DownloadHints* pHints);
2767     FX_BOOL                             CheckTrailerAppend(IFX_DownloadHints* pHints);
2768     FX_BOOL                             CheckPageStatus(IFX_DownloadHints* pHints);
2769     FX_BOOL                             CheckAllCrossRefStream(IFX_DownloadHints *pHints);
2770
2771     FX_DWORD                            CheckCrossRefStream(IFX_DownloadHints *pHints, FX_FILESIZE &xref_offset);
2772     FX_BOOL                             IsLinearizedFile(FX_LPBYTE pData, FX_DWORD dwLen);
2773     void                                SetStartOffset(FX_FILESIZE dwOffset);
2774     FX_BOOL                             GetNextToken(CFX_ByteString &token);
2775     FX_BOOL                             GetNextChar(FX_BYTE &ch);
2776     CPDF_Object *                       ParseIndirectObjectAt(FX_FILESIZE pos, FX_DWORD objnum);
2777     CPDF_Object *                       GetObject(FX_DWORD objnum, IFX_DownloadHints* pHints, FX_BOOL *pExistInFile);
2778     FX_BOOL                             GetPageKids(CPDF_Parser *pParser, CPDF_Object *pPages);
2779     FX_BOOL                             PreparePageItem();
2780     FX_BOOL                             LoadPages(IFX_DownloadHints* pHints);
2781     FX_BOOL                             LoadAllXref(IFX_DownloadHints* pHints);
2782     FX_BOOL                             LoadAllFile(IFX_DownloadHints* pHints);
2783     FX_BOOL                             CheckLinearizedData(IFX_DownloadHints* pHints);
2784     FX_BOOL                             CheckFileResources(IFX_DownloadHints* pHints);
2785     FX_BOOL                             CheckPageAnnots(int iPage, IFX_DownloadHints* pHints);
2786
2787     FX_BOOL                             CheckLinearizedFirstPage(int iPage, IFX_DownloadHints* pHints);
2788     FX_BOOL                             HaveResourceAncestor(CPDF_Dictionary *pDict);
2789     FX_BOOL                             CheckPage(FX_INT32 iPage, IFX_DownloadHints* pHints);
2790     FX_BOOL                             LoadDocPages(IFX_DownloadHints* pHints);
2791     FX_BOOL                             LoadDocPage(FX_INT32 iPage, IFX_DownloadHints* pHints);
2792     FX_BOOL                             CheckPageNode(CPDF_PageNode &pageNodes, FX_INT32 iPage, FX_INT32 &iCount, IFX_DownloadHints* pHints);
2793     FX_BOOL                             CheckUnkownPageNode(FX_DWORD dwPageNo, CPDF_PageNode *pPageNode, IFX_DownloadHints* pHints);
2794     FX_BOOL                             CheckArrayPageNode(FX_DWORD dwPageNo, CPDF_PageNode *pPageNode, IFX_DownloadHints* pHints);
2795     FX_BOOL                             CheckPageCount(IFX_DownloadHints* pHints);
2796     FX_BOOL                             IsFirstCheck(int iPage);
2797     void                                ResetFirstCheck(int iPage);
2798
2799     CPDF_Parser                         m_parser;
2800
2801     CPDF_SyntaxParser                   m_syntaxParser;
2802
2803     CPDF_Object                         *m_pRoot;
2804
2805     FX_DWORD                            m_dwRootObjNum;
2806
2807     FX_DWORD                            m_dwInfoObjNum;
2808
2809     CPDF_Object                         *m_pLinearized;
2810
2811     CPDF_Object                         *m_pTrailer;
2812
2813     FX_BOOL                             m_bDocAvail;
2814
2815     FX_FILESIZE                         m_dwHeaderOffset;
2816
2817     FX_FILESIZE                         m_dwLastXRefOffset;
2818
2819     FX_FILESIZE                         m_dwXRefOffset;
2820
2821     FX_FILESIZE                         m_dwTrailerOffset;
2822
2823     FX_FILESIZE                         m_dwCurrentOffset;
2824
2825     PDF_DATAAVAIL_STATUS                m_docStatus;
2826
2827     FX_FILESIZE                         m_dwFileLen;
2828
2829     CPDF_Document*                      m_pDocument;
2830
2831     CPDF_SortObjNumArray                m_objnum_array;
2832
2833     CFX_PtrArray                        m_objs_array;
2834
2835     FX_FILESIZE                         m_Pos;
2836
2837     FX_FILESIZE                         m_bufferOffset;
2838
2839     FX_DWORD                            m_bufferSize;
2840
2841     CFX_ByteString                      m_WordBuf;
2842
2843     FX_BYTE                             m_WordBuffer[257];
2844
2845     FX_DWORD                            m_WordSize;
2846
2847     FX_BYTE                             m_bufferData[512];
2848
2849     CFX_FileSizeArray                   m_CrossOffset;
2850
2851     CFX_DWordArray                      m_XRefStreamList;
2852
2853     CFX_DWordArray                      m_PageObjList;
2854
2855     FX_DWORD                            m_PagesObjNum;
2856
2857     FX_BOOL                             m_bLinearized;
2858
2859     FX_DWORD                            m_dwFirstPageNo;
2860
2861     FX_BOOL                             m_bLinearedDataOK;
2862
2863     FX_BOOL                             m_bMainXRefLoadTried;
2864
2865     FX_BOOL                             m_bMainXRefLoadedOK;
2866
2867     FX_BOOL                             m_bPagesTreeLoad;
2868
2869     FX_BOOL                             m_bPagesLoad;
2870
2871     CPDF_Parser *                       m_pCurrentParser;
2872
2873     FX_FILESIZE                         m_dwCurrentXRefSteam;
2874
2875     FX_BOOL                             m_bAnnotsLoad;
2876
2877     FX_BOOL                             m_bHaveAcroForm;
2878
2879     FX_DWORD                            m_dwAcroFormObjNum;
2880
2881     FX_BOOL                             m_bAcroFormLoad;
2882
2883     CPDF_Object *                       m_pAcroForm;
2884
2885     CFX_PtrArray                        m_arrayAcroforms;
2886
2887     CPDF_Dictionary *                   m_pPageDict;
2888
2889     CPDF_Object *                       m_pPageResource;
2890
2891     FX_BOOL                             m_bNeedDownLoadResource;
2892
2893     FX_BOOL                             m_bPageLoadedOK;
2894
2895     FX_BOOL                             m_bLinearizedFormParamLoad;
2896
2897     CFX_PtrArray                        m_PagesArray;
2898
2899     FX_DWORD                            m_dwEncryptObjNum;
2900
2901     FX_FILESIZE                         m_dwPrevXRefOffset;
2902
2903     FX_BOOL                             m_bTotalLoadPageTree;
2904
2905     FX_BOOL                             m_bCurPageDictLoadOK;
2906
2907     CPDF_PageNode                       m_pageNodes;
2908
2909     CFX_CMapDWordToDWord *              m_pageMapCheckState;
2910
2911     CFX_CMapDWordToDWord *              m_pagesLoadState;
2912 };
2913
2914 IPDF_DataAvail::IPDF_DataAvail(IFX_FileAvail* pFileAvail, IFX_FileRead* pFileRead) :
2915     m_pFileAvail(pFileAvail),
2916     m_pFileRead(pFileRead) {
2917 }
2918
2919 // static
2920 IPDF_DataAvail* IPDF_DataAvail::Create(IFX_FileAvail* pFileAvail, IFX_FileRead* pFileRead)
2921 {
2922   return FX_NEW CPDF_DataAvail(pFileAvail, pFileRead);
2923 }
2924
2925 // static
2926 int CPDF_DataAvail::s_CurrentDataAvailRecursionDepth = 0;
2927
2928 CPDF_DataAvail::CPDF_DataAvail(IFX_FileAvail* pFileAvail, IFX_FileRead* pFileRead)
2929     : IPDF_DataAvail(pFileAvail, pFileRead)
2930 {
2931     m_Pos = 0;
2932     m_dwFileLen = 0;
2933     if (m_pFileRead) {
2934         m_dwFileLen = (FX_DWORD)m_pFileRead->GetSize();
2935     }
2936     m_dwCurrentOffset = 0;
2937     m_WordSize = 0;
2938     m_dwXRefOffset = 0;
2939     m_bufferOffset = 0;
2940     m_dwFirstPageNo = 0;
2941     m_bufferSize = 0;
2942     m_PagesObjNum = 0;
2943     m_dwCurrentXRefSteam = 0;
2944     m_dwAcroFormObjNum = 0;
2945     m_dwInfoObjNum = 0;
2946     m_pDocument = 0;
2947     m_dwEncryptObjNum = 0;
2948     m_dwPrevXRefOffset = 0;
2949     m_dwLastXRefOffset = 0;
2950     m_bDocAvail = FALSE;
2951     m_bMainXRefLoadTried = FALSE;
2952     m_bDocAvail = FALSE;
2953     m_bLinearized = FALSE;
2954     m_bPagesLoad = FALSE;
2955     m_bPagesTreeLoad = FALSE;
2956     m_bMainXRefLoadedOK = FALSE;
2957     m_bAnnotsLoad = FALSE;
2958     m_bHaveAcroForm = FALSE;
2959     m_bAcroFormLoad = FALSE;
2960     m_bPageLoadedOK = FALSE;
2961     m_bNeedDownLoadResource = FALSE;
2962     m_bLinearizedFormParamLoad = FALSE;
2963     m_pLinearized = NULL;
2964     m_pRoot = NULL;
2965     m_pTrailer = NULL;
2966     m_pCurrentParser = NULL;
2967     m_pAcroForm = NULL;
2968     m_pPageDict = NULL;
2969     m_pPageResource = NULL;
2970     m_pageMapCheckState = NULL;
2971     m_docStatus = PDF_DATAAVAIL_HEADER;
2972     m_parser.m_bOwnFileRead = FALSE;
2973     m_bTotalLoadPageTree = FALSE;
2974     m_bCurPageDictLoadOK = FALSE;
2975     m_bLinearedDataOK = FALSE;
2976     m_pagesLoadState = NULL;
2977 }
2978 CPDF_DataAvail::~CPDF_DataAvail()
2979 {
2980     if (m_pLinearized)  {
2981         m_pLinearized->Release();
2982     }
2983     if (m_pRoot) {
2984         m_pRoot->Release();
2985     }
2986     if (m_pTrailer) {
2987         m_pTrailer->Release();
2988     }
2989     if (m_pageMapCheckState) {
2990         delete m_pageMapCheckState;
2991     }
2992     if (m_pagesLoadState) {
2993         delete m_pagesLoadState;
2994     }
2995     FX_INT32 i = 0;
2996     FX_INT32 iSize = m_arrayAcroforms.GetSize();
2997     for (i = 0; i < iSize; ++i) {
2998         ((CPDF_Object *)m_arrayAcroforms.GetAt(i))->Release();
2999     }
3000 }
3001 void CPDF_DataAvail::SetDocument(CPDF_Document* pDoc)
3002 {
3003     m_pDocument = pDoc;
3004 }
3005 FX_DWORD CPDF_DataAvail::GetObjectSize(FX_DWORD objnum, FX_FILESIZE& offset)
3006 {
3007     CPDF_Parser *pParser = (CPDF_Parser *)(m_pDocument->GetParser());
3008     if (pParser == NULL) {
3009         return 0;
3010     }
3011     if (objnum >= (FX_DWORD)pParser->m_CrossRef.GetSize()) {
3012         return 0;
3013     }
3014     if (pParser->m_V5Type[objnum] == 2) {
3015         objnum = (FX_DWORD)pParser->m_CrossRef[objnum];
3016     }
3017     if (pParser->m_V5Type[objnum] == 1 || pParser->m_V5Type[objnum] == 255) {
3018         offset = pParser->m_CrossRef[objnum];
3019         if (offset == 0) {
3020             return 0;
3021         }
3022         FX_LPVOID pResult = FXSYS_bsearch(&offset, pParser->m_SortedOffset.GetData(), pParser->m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
3023         if (pResult == NULL) {
3024             return 0;
3025         }
3026         if ((FX_FILESIZE*)pResult - (FX_FILESIZE*)pParser->m_SortedOffset.GetData() == pParser->m_SortedOffset.GetSize() - 1) {
3027             return 0;
3028         }
3029         return (FX_DWORD)(((FX_FILESIZE*)pResult)[1] - offset);
3030     }
3031     return 0;
3032 }
3033 FX_BOOL CPDF_DataAvail::IsObjectsAvail(CFX_PtrArray& obj_array, FX_BOOL bParsePage, IFX_DownloadHints* pHints, CFX_PtrArray &ret_array)
3034 {
3035     if (!obj_array.GetSize()) {
3036         return TRUE;
3037     }
3038     FX_DWORD count = 0;
3039     CFX_PtrArray new_obj_array;
3040     FX_INT32 i = 0;
3041     for (i = 0; i < obj_array.GetSize(); i++) {
3042         CPDF_Object *pObj = (CPDF_Object *)obj_array[i];
3043         if (!pObj) {
3044             continue;
3045         }
3046         FX_INT32 type = pObj->GetType();
3047         switch (type) {
3048             case PDFOBJ_ARRAY: {
3049                     CPDF_Array *pArray = pObj->GetArray();
3050                     for (FX_DWORD k = 0; k < pArray->GetCount(); k++) {
3051                         new_obj_array.Add(pArray->GetElement(k));
3052                     }
3053                 }
3054                 break;
3055             case PDFOBJ_STREAM:
3056                 pObj = pObj->GetDict();
3057             case PDFOBJ_DICTIONARY: {
3058                     CPDF_Dictionary *pDict = pObj->GetDict();
3059                     if (pDict && pDict->GetString("Type") == "Page" && !bParsePage) {
3060                         continue;
3061                     }
3062                     FX_POSITION pos = pDict->GetStartPos();
3063                     while (pos) {
3064                         CPDF_Object *value;
3065                         CFX_ByteString key;
3066                         value = pDict->GetNextElement(pos, key);
3067                         if (key != "Parent") {
3068                             new_obj_array.Add(value);
3069                         }
3070                     }
3071                 }
3072                 break;
3073             case PDFOBJ_REFERENCE: {
3074                     CPDF_Reference *pRef = (CPDF_Reference*)pObj;
3075                     FX_DWORD dwNum = pRef->GetRefObjNum();
3076                     FX_FILESIZE offset;
3077                     FX_DWORD original_size = GetObjectSize(dwNum, offset);
3078                     pdfium::base::CheckedNumeric<FX_DWORD> size = original_size;
3079                     if (size.ValueOrDefault(0) == 0 || offset < 0 || offset >= m_dwFileLen) {
3080                         break;
3081                     }
3082                     
3083                     size += offset;
3084                     size += 512;
3085                     if (!size.IsValid()) {
3086                         break;
3087                     }
3088                     if (size.ValueOrDie() > m_dwFileLen) {
3089                         size = m_dwFileLen - offset;
3090                     } else {
3091                         size = original_size + 512;
3092                     }
3093                     if (!size.IsValid()) {
3094                         break;
3095                     }
3096                     if (!m_pFileAvail->IsDataAvail(offset, size.ValueOrDie())) {
3097                         pHints->AddSegment(offset, size.ValueOrDie());
3098                         ret_array.Add(pObj);
3099                         count++;
3100                     } else if (!m_objnum_array.Find(dwNum)) {
3101                         m_objnum_array.AddObjNum(dwNum);
3102                         CPDF_Object *pReferred = m_pDocument->GetIndirectObject(pRef->GetRefObjNum(), NULL);
3103                         if (pReferred) {
3104                             new_obj_array.Add(pReferred);
3105                         }
3106                     }
3107                 }
3108                 break;
3109         }
3110     }
3111     if (count > 0) {
3112         FX_INT32 iSize = new_obj_array.GetSize();
3113         for (i = 0; i < iSize; ++i) {
3114             CPDF_Object *pObj = (CPDF_Object *)new_obj_array[i];
3115             FX_INT32 type = pObj->GetType();
3116             if (type == PDFOBJ_REFERENCE) {
3117                 CPDF_Reference *pRef = (CPDF_Reference *)pObj;
3118                 FX_DWORD dwNum = pRef->GetRefObjNum();
3119                 if (!m_objnum_array.Find(dwNum)) {
3120                     ret_array.Add(pObj);
3121                 }
3122             } else {
3123                 ret_array.Add(pObj);
3124             }
3125         }
3126         return FALSE;
3127     }
3128     obj_array.RemoveAll();
3129     obj_array.Append(new_obj_array);
3130     return IsObjectsAvail(obj_array, FALSE, pHints, ret_array);
3131 }
3132 FX_BOOL CPDF_DataAvail::IsDocAvail(IFX_DownloadHints* pHints)
3133 {
3134     if (!m_dwFileLen && m_pFileRead) {
3135         m_dwFileLen = (FX_DWORD)m_pFileRead->GetSize();
3136         if (!m_dwFileLen) {
3137             return TRUE;
3138         }
3139     }
3140     while (!m_bDocAvail) {
3141         if (!CheckDocStatus(pHints)) {
3142             return FALSE;
3143         }
3144     }
3145     return TRUE;
3146 }
3147 FX_BOOL CPDF_DataAvail::CheckAcroFormSubObject(IFX_DownloadHints* pHints)
3148 {
3149     if (!m_objs_array.GetSize()) {
3150         m_objs_array.RemoveAll();
3151         m_objnum_array.RemoveAll();
3152         CFX_PtrArray obj_array;
3153         obj_array.Append(m_arrayAcroforms);
3154         FX_BOOL bRet = IsObjectsAvail(obj_array, FALSE, pHints, m_objs_array);
3155         if (bRet) {
3156             m_objs_array.RemoveAll();
3157         }
3158         return bRet;
3159     } else {
3160         CFX_PtrArray new_objs_array;
3161         FX_BOOL bRet = IsObjectsAvail(m_objs_array, FALSE, pHints, new_objs_array);
3162         if (bRet) {
3163             FX_INT32 iSize = m_arrayAcroforms.GetSize();
3164             for (FX_INT32 i = 0; i < iSize; ++i) {
3165                 ((CPDF_Object *)m_arrayAcroforms.GetAt(i))->Release();
3166             }
3167             m_arrayAcroforms.RemoveAll();
3168         } else {
3169             m_objs_array.RemoveAll();
3170             m_objs_array.Append(new_objs_array);
3171         }
3172         return bRet;
3173     }
3174 }
3175 FX_BOOL CPDF_DataAvail::CheckAcroForm(IFX_DownloadHints* pHints)
3176 {
3177     FX_BOOL bExist = FALSE;
3178     m_pAcroForm = GetObject(m_dwAcroFormObjNum, pHints, &bExist);
3179     if (!bExist) {
3180         m_docStatus = PDF_DATAAVAIL_PAGETREE;
3181         return TRUE;
3182     }
3183     if (!m_pAcroForm) {
3184         if (m_docStatus == PDF_DATAAVAIL_ERROR) {
3185             m_docStatus = PDF_DATAAVAIL_LOADALLFILE;
3186             return TRUE;
3187         }
3188         return FALSE;
3189     }
3190     m_arrayAcroforms.Add(m_pAcroForm);
3191     m_docStatus = PDF_DATAAVAIL_PAGETREE;
3192     return TRUE;
3193 }
3194 FX_BOOL CPDF_DataAvail::CheckDocStatus(IFX_DownloadHints *pHints)
3195 {
3196     switch (m_docStatus) {
3197         case PDF_DATAAVAIL_HEADER:
3198             return CheckHeader(pHints);
3199         case PDF_DATAAVAIL_FIRSTPAGE:
3200         case PDF_DATAAVAIL_FIRSTPAGE_PREPARE:
3201             return CheckFirstPage(pHints);
3202         case PDF_DATAAVAIL_END:
3203             return CheckEnd(pHints);
3204         case PDF_DATAAVAIL_CROSSREF:
3205             return CheckCrossRef(pHints);
3206         case PDF_DATAAVAIL_CROSSREF_ITEM:
3207             return CheckCrossRefItem(pHints);
3208         case PDF_DATAAVAIL_CROSSREF_STREAM:
3209             return CheckAllCrossRefStream(pHints);
3210         case PDF_DATAAVAIL_TRAILER:
3211             return CheckTrailer(pHints);
3212         case PDF_DATAAVAIL_TRAILER_APPEND:
3213             return CheckTrailerAppend(pHints);
3214         case PDF_DATAAVAIL_LOADALLCRSOSSREF:
3215             return LoadAllXref(pHints);
3216         case PDF_DATAAVAIL_LOADALLFILE:
3217             return LoadAllFile(pHints);
3218         case PDF_DATAAVAIL_ROOT:
3219             return CheckRoot(pHints);
3220         case PDF_DATAAVAIL_INFO:
3221             return CheckInfo(pHints);
3222         case PDF_DATAAVAIL_ACROFORM:
3223             return CheckAcroForm(pHints);
3224         case PDF_DATAAVAIL_PAGETREE:
3225             if (m_bTotalLoadPageTree) {
3226                 return CheckPages(pHints);
3227             } else {
3228                 return LoadDocPages(pHints);
3229             }
3230         case PDF_DATAAVAIL_PAGE:
3231             if (m_bTotalLoadPageTree) {
3232                 return CheckPage(pHints);
3233             } else {
3234                 m_docStatus = PDF_DATAAVAIL_PAGE_LATERLOAD;
3235                 return TRUE;
3236             }
3237         case PDF_DATAAVAIL_ERROR:
3238             return LoadAllFile(pHints);
3239         case PDF_DATAAVAIL_PAGE_LATERLOAD:
3240             m_docStatus = PDF_DATAAVAIL_PAGE;
3241         default:
3242             m_bDocAvail = TRUE;
3243             return TRUE;
3244     }
3245 }
3246 FX_BOOL CPDF_DataAvail::CheckPageStatus(IFX_DownloadHints* pHints)
3247 {
3248     switch (m_docStatus) {
3249         case PDF_DATAAVAIL_PAGETREE:
3250             return CheckPages(pHints);
3251         case PDF_DATAAVAIL_PAGE:
3252             return CheckPage(pHints);
3253         case PDF_DATAAVAIL_ERROR:
3254             return LoadAllFile(pHints);
3255         default:
3256             m_bPagesTreeLoad = TRUE;
3257             m_bPagesLoad = TRUE;
3258             return TRUE;
3259     }
3260 }
3261 FX_BOOL CPDF_DataAvail::LoadAllFile(IFX_DownloadHints* pHints)
3262 {
3263     if (m_pFileAvail->IsDataAvail(0, (FX_DWORD)m_dwFileLen)) {
3264         m_docStatus = PDF_DATAAVAIL_DONE;
3265         return TRUE;
3266     }
3267     pHints->AddSegment(0, (FX_DWORD)m_dwFileLen);
3268     return FALSE;
3269 }
3270 FX_BOOL CPDF_DataAvail::LoadAllXref(IFX_DownloadHints* pHints)
3271 {
3272     m_parser.m_Syntax.InitParser(m_pFileRead, (FX_DWORD)m_dwHeaderOffset);
3273     m_parser.m_bOwnFileRead = FALSE;
3274     if (!m_parser.LoadAllCrossRefV4(m_dwLastXRefOffset) && !m_parser.LoadAllCrossRefV5(m_dwLastXRefOffset)) {
3275         m_docStatus = PDF_DATAAVAIL_LOADALLFILE;
3276         return FALSE;
3277     }
3278     FXSYS_qsort(m_parser.m_SortedOffset.GetData(), m_parser.m_SortedOffset.GetSize(), sizeof(FX_FILESIZE), _CompareFileSize);
3279     m_dwRootObjNum = m_parser.GetRootObjNum();
3280     m_dwInfoObjNum = m_parser.GetInfoObjNum();
3281     m_pCurrentParser = &m_parser;
3282     m_docStatus = PDF_DATAAVAIL_ROOT;
3283     return TRUE;
3284 }
3285 CPDF_Object* CPDF_DataAvail::GetObject(FX_DWORD objnum, IFX_DownloadHints* pHints, FX_BOOL *pExistInFile)
3286 {
3287     CPDF_Object *pRet         = NULL;
3288     FX_DWORD    original_size = 0;
3289     FX_FILESIZE offset        = 0;
3290     CPDF_Parser *pParser      = NULL;
3291
3292     if (pExistInFile) { 
3293         *pExistInFile = TRUE;
3294     }
3295
3296     if (m_pDocument == NULL) {
3297         original_size = (FX_DWORD)m_parser.GetObjectSize(objnum);
3298         offset        = m_parser.GetObjectOffset(objnum);
3299         pParser       = &m_parser; 
3300     } else {
3301         original_size = GetObjectSize(objnum, offset);
3302         pParser       = (CPDF_Parser *)(m_pDocument->GetParser());
3303     }
3304
3305     pdfium::base::CheckedNumeric<FX_DWORD> size = original_size;
3306     if (size.ValueOrDefault(0) == 0 || offset < 0 || offset >= m_dwFileLen) {
3307         if (pExistInFile)
3308            *pExistInFile = FALSE;
3309
3310         return NULL;
3311     }
3312  
3313     size += offset;
3314     size += 512;
3315     if (!size.IsValid()) {
3316         return NULL;
3317     }
3318
3319     if (size.ValueOrDie() > m_dwFileLen) {
3320         size = m_dwFileLen - offset;
3321     } else {
3322         size = original_size + 512;
3323     }
3324
3325     if (!size.IsValid()) {
3326         return NULL;
3327     }
3328
3329     if (!m_pFileAvail->IsDataAvail(offset, size.ValueOrDie())) {
3330         pHints->AddSegment(offset, size.ValueOrDie());
3331         return NULL;
3332     }
3333
3334     if (pParser) {
3335         pRet = pParser->ParseIndirectObject(NULL, objnum, NULL);
3336     }
3337
3338     if (!pRet && pExistInFile) {
3339         *pExistInFile = FALSE;
3340     }
3341  
3342     return pRet;
3343 }
3344
3345 FX_BOOL CPDF_DataAvail::CheckInfo(IFX_DownloadHints* pHints)
3346 {
3347     FX_BOOL bExist = FALSE;
3348     CPDF_Object *pInfo = GetObject(m_dwInfoObjNum, pHints, &bExist);
3349     if (!bExist) {
3350         if (m_bHaveAcroForm) {
3351             m_docStatus = PDF_DATAAVAIL_ACROFORM;
3352         } else {
3353             m_docStatus = PDF_DATAAVAIL_PAGETREE;
3354         }
3355         return TRUE;
3356     }
3357     if (!pInfo) {
3358         if (m_docStatus == PDF_DATAAVAIL_ERROR) {
3359             m_docStatus = PDF_DATAAVAIL_LOADALLFILE;
3360             return TRUE;
3361         }
3362         if (m_Pos == m_dwFileLen) {
3363             m_docStatus = PDF_DATAAVAIL_ERROR;
3364         }
3365         return FALSE;
3366     }
3367     if (pInfo) {
3368         pInfo->Release();
3369     }
3370     if (m_bHaveAcroForm) {
3371         m_docStatus = PDF_DATAAVAIL_ACROFORM;
3372     } else {
3373         m_docStatus = PDF_DATAAVAIL_PAGETREE;
3374     }
3375     return TRUE;
3376 }
3377 FX_BOOL CPDF_DataAvail::CheckRoot(IFX_DownloadHints* pHints)
3378 {
3379     FX_BOOL bExist = FALSE;
3380     m_pRoot = GetObject(m_dwRootObjNum, pHints, &bExist);
3381     if (!bExist) {
3382         m_docStatus = PDF_DATAAVAIL_LOADALLFILE;
3383         return TRUE;
3384     }
3385     if (!m_pRoot) {
3386         if (m_docStatus == PDF_DATAAVAIL_ERROR) {
3387             m_docStatus = PDF_DATAAVAIL_LOADALLFILE;
3388             return TRUE;
3389         }
3390         return FALSE;
3391     }
3392     CPDF_Dictionary* pDict = m_pRoot->GetDict();
3393     if (!pDict) {
3394         m_docStatus = PDF_DATAAVAIL_ERROR;
3395         return FALSE;
3396     }
3397     CPDF_Reference* pRef = (CPDF_Reference*)pDict->GetElement(FX_BSTRC("Pages"));
3398     if (pRef == NULL || pRef->GetType() != PDFOBJ_REFERENCE) {
3399         m_docStatus = PDF_DATAAVAIL_ERROR;
3400         return FALSE;
3401     }
3402     m_PagesObjNum = pRef->GetRefObjNum();
3403     CPDF_Reference* pAcroFormRef = (CPDF_Reference*)m_pRoot->GetDict()->GetElement(FX_BSTRC("AcroForm"));
3404     if (pAcroFormRef && pAcroFormRef->GetType() == PDFOBJ_REFERENCE) {
3405         m_bHaveAcroForm = TRUE;
3406         m_dwAcroFormObjNum = pAcroFormRef->GetRefObjNum();
3407     }
3408     if (m_dwInfoObjNum) {
3409         m_docStatus = PDF_DATAAVAIL_INFO;
3410     } else {
3411         if (m_bHaveAcroForm) {
3412             m_docStatus = PDF_DATAAVAIL_ACROFORM;
3413         } else {
3414             m_docStatus = PDF_DATAAVAIL_PAGETREE;
3415         }
3416     }
3417     return TRUE;
3418 }
3419 FX_BOOL CPDF_DataAvail::PreparePageItem()
3420 {
3421     CPDF_Dictionary *pRoot = m_pDocument->GetRoot();
3422     CPDF_Reference* pRef = pRoot ? (CPDF_Reference*)pRoot->GetElement(FX_BSTRC("Pages")) : NULL;
3423     if (pRef == NULL || pRef->GetType() != PDFOBJ_REFERENCE) {
3424         m_docStatus = PDF_DATAAVAIL_ERROR;
3425         return FALSE;
3426     }
3427     m_PagesObjNum = pRef->GetRefObjNum();
3428     m_pCurrentParser = (CPDF_Parser *)m_pDocument->GetParser();
3429     m_docStatus = PDF_DATAAVAIL_PAGETREE;
3430     return TRUE;
3431 }
3432 FX_BOOL CPDF_DataAvail::IsFirstCheck(int iPage)
3433 {
3434     if (NULL == m_pageMapCheckState) {
3435         m_pageMapCheckState = FX_NEW CFX_CMapDWordToDWord();
3436     }
3437     FX_DWORD dwValue = 0;
3438     if (!m_pageMapCheckState->Lookup(iPage, dwValue)) {
3439         m_pageMapCheckState->SetAt(iPage, 1);
3440         return TRUE;
3441     }
3442     if (dwValue != 0) {
3443         return FALSE;
3444     }
3445     m_pageMapCheckState->SetAt(iPage, 1);
3446     return TRUE;
3447 }
3448 void CPDF_DataAvail::ResetFirstCheck(int iPage)
3449 {
3450     if (NULL == m_pageMapCheckState) {
3451         m_pageMapCheckState = FX_NEW CFX_CMapDWordToDWord();
3452     }
3453     FX_DWORD dwValue = 1;
3454     if (!m_pageMapCheckState->Lookup(iPage, dwValue)) {
3455         return;
3456     }
3457     m_pageMapCheckState->SetAt(iPage, 0);
3458 }
3459 FX_BOOL CPDF_DataAvail::CheckPage(IFX_DownloadHints* pHints)
3460 {
3461     FX_DWORD iPageObjs = m_PageObjList.GetSize();
3462     CFX_DWordArray UnavailObjList;
3463     for (FX_DWORD i = 0; i < iPageObjs; ++i) {
3464         FX_DWORD dwPageObjNum = m_PageObjList.GetAt(i);
3465         FX_BOOL bExist = FALSE;
3466         CPDF_Object *pObj = GetObject(dwPageObjNum, pHints, &bExist);
3467         if (!pObj) {
3468             if (bExist) {
3469                 UnavailObjList.Add(dwPageObjNum);
3470             }
3471             continue;
3472         }
3473         if (pObj->GetType() == PDFOBJ_ARRAY) {
3474             CPDF_Array *pArray = pObj->GetArray();
3475             if (pArray) {
3476                 FX_INT32 iSize = pArray->GetCount();
3477                 CPDF_Object *pItem = NULL;
3478                 for (FX_INT32 j = 0; j < iSize; ++j) {
3479                     pItem = pArray->GetElement(j);
3480                     if (pItem && pItem->GetType() == PDFOBJ_REFERENCE) {
3481                         UnavailObjList.Add(((CPDF_Reference *)pItem)->GetRefObjNum());
3482                     }
3483                 }
3484             }
3485         }
3486         if (pObj->GetType() != PDFOBJ_DICTIONARY) {
3487             pObj->Release();
3488             continue;
3489         }
3490         CFX_ByteString type = pObj->GetDict()->GetString(FX_BSTRC("Type"));
3491         if (type == FX_BSTRC("Pages")) {
3492             m_PagesArray.Add(pObj);
3493             continue;
3494         }
3495         pObj->Release();
3496     }
3497     m_PageObjList.RemoveAll();
3498     if (UnavailObjList.GetSize()) {
3499         m_PageObjList.Append(UnavailObjList);
3500         return FALSE;
3501     }
3502     FX_DWORD iPages = m_PagesArray.GetSize();
3503     for (FX_DWORD i = 0; i < iPages; i++) {
3504         CPDF_Object *pPages = (CPDF_Object *)m_PagesArray.GetAt(i);
3505         if (!pPages) {
3506             continue;
3507         }
3508         if (!GetPageKids(m_pCurrentParser, pPages)) {
3509             pPages->Release();
3510             while (++i < iPages) {
3511                 pPages = (CPDF_Object *)m_PagesArray.GetAt(i);
3512                 pPages->Release();
3513             }
3514             m_PagesArray.RemoveAll();
3515             m_docStatus = PDF_DATAAVAIL_ERROR;
3516             return FALSE;
3517         }
3518         pPages->Release();
3519     }
3520     m_PagesArray.RemoveAll();
3521     if (!m_PageObjList.GetSize()) {
3522         m_docStatus = PDF_DATAAVAIL_DONE;
3523     }
3524     return TRUE;
3525 }
3526 FX_BOOL CPDF_DataAvail::GetPageKids(CPDF_Parser *pParser, CPDF_Object *pPages)
3527 {
3528     if (!pParser) {
3529         m_docStatus = PDF_DATAAVAIL_ERROR;
3530         return FALSE;
3531     }
3532     CPDF_Dictionary* pDict = pPages->GetDict();
3533     CPDF_Object *pKids = pDict ? pDict->GetElement(FX_BSTRC("Kids")) : NULL;
3534     if (!pKids) {
3535         return TRUE;
3