3cfc3e7dbbe07a0f91e318c076626453406229df
[pdfium.git] / testing / tools / run_corpus_tests.py
1 #!/usr/bin/env python
2 # Copyright 2015 The PDFium Authors. All rights reserved.
3 # Use of this source code is governed by a BSD-style license that can be
4 # found in the LICENSE file.
5
6 import optparse
7 import os
8 import re
9 import subprocess
10 import sys
11
12 # Nomenclature:
13 #   x_root - "x"
14 #   x_filename - "x.ext"
15 #   x_path - "path/to/a/b/c/x.ext"
16 #   c_dir - "path/to/a/b/c"
17
18 def test_one_file(input_filename, source_dir, working_dir,
19                   pdfium_test_path, pdfium_diff_path):
20   input_root, _ = os.path.splitext(input_filename)
21   input_path = os.path.join(source_dir, input_filename)
22   pdf_path = os.path.join(working_dir, input_filename)
23   actual_path_template = os.path.join(working_dir, input_root + '.pdf.%d.png')
24   expected_path_template = os.path.join(source_dir,
25                                         input_root + '_expected.pdf.%d.png')
26   try:
27     sys.stdout.flush()
28     subprocess.check_call(['cp', input_path, pdf_path])
29     subprocess.check_call([pdfium_test_path, '--png', pdf_path])
30     i = 0;
31     while True:
32       expected_path = expected_path_template % i;
33       actual_path = actual_path_template % i;
34       if not os.path.exists(expected_path):
35         if i == 0:
36           print "WARNING: no expected results files found for " + input_filename
37         break
38       print "Checking " + actual_path
39       sys.stdout.flush()
40       subprocess.check_call([pdfium_diff_path, expected_path, actual_path])
41       i += 1
42   except subprocess.CalledProcessError as e:
43     print "FAILURE: " + input_filename + "; " + str(e)
44     return False
45   return True
46
47 def main():
48   parser = optparse.OptionParser()
49   parser.add_option('--build-dir', default=os.path.join('out', 'Debug'),
50                     help='relative path from the base source directory')
51   options, args = parser.parse_args()
52
53   # Expect |my_dir| to be .../pdfium/testing/tools.
54   my_dir = os.path.dirname(os.path.realpath(__file__))
55   testing_dir = os.path.dirname(my_dir)
56   pdfium_dir = os.path.dirname(testing_dir)
57   if (os.path.basename(my_dir) != 'tools' or
58       os.path.basename(testing_dir) != 'testing'):
59     print 'Confused, can not find pdfium root directory, aborting.'
60     return 1
61
62   # Find path to build directory.  This depends on whether this is a
63   # standalone build vs. a build as part of a chromium checkout. For
64   # standalone, we expect a path like .../pdfium/out/Debug, but for
65   # chromium, we expect a path like .../src/out/Debug two levels
66   # higher (to skip over the third_party/pdfium path component under
67   # which chromium sticks pdfium).
68   base_dir = pdfium_dir
69   one_up_dir = os.path.dirname(base_dir)
70   two_up_dir = os.path.dirname(one_up_dir)
71   if (os.path.basename(two_up_dir) == 'src' and
72       os.path.basename(one_up_dir) == 'third_party'):
73     base_dir = two_up_dir
74   build_dir = os.path.join(base_dir, options.build_dir)
75
76   # Compiled binaries are found under the build path.
77   pdfium_test_path = os.path.join(build_dir, 'pdfium_test')
78   pdfium_diff_path = os.path.join(build_dir, 'pdfium_diff')
79   if sys.platform.startswith('win'):
80     pdfium_test_path = pdfium_test_path + '.exe'
81     pdfium_diff_path = pdfium_diff_path + '.exe'
82   # TODO(tsepez): Mac may require special handling here.
83
84   # Place generated files under the build directory, not source directory.
85   working_dir = os.path.join(build_dir, 'gen', 'pdfium', 'testing', 'corpus')
86   if not os.path.exists(working_dir):
87     os.makedirs(working_dir)
88
89   # test files are under .../pdfium/testing/corpus.
90   failures = []
91   walk_from_dir = os.path.join(testing_dir, 'corpus');
92   input_file_re = re.compile('^[a-zA-Z0-9_.]+[.]pdf$')
93   for source_dir, _, filename_list in os.walk(walk_from_dir):
94     for input_filename in filename_list:
95       if input_file_re.match(input_filename):
96          input_path = os.path.join(source_dir, input_filename)
97          if os.path.isfile(input_path):
98            if not test_one_file(input_filename, source_dir, working_dir,
99                                 pdfium_test_path, pdfium_diff_path):
100              failures.append(input_path)
101
102   if failures:
103     print '\n\nSummary of Failures:'
104     for failure in failures:
105       print failure
106     return 1
107
108   return 0
109
110
111 if __name__ == '__main__':
112   sys.exit(main())