1
=== added file 'add-missing-result-yaml-files.py'
2
--- add-missing-result-yaml-files.py	1970-01-01 00:00:00 +0000
3
+++ add-missing-result-yaml-files.py	2014-09-26 15:12:24 +0000
4
@@ -0,0 +1,135 @@
5
1
#!/usr/bin/env python
6
2
7
3
"""Add missing result.yaml in S3; ensue that existing files contain
8
4
the final result.
9
5
"""
10
6
11
7
from __future__ import print_function
12
8
from argparse import ArgumentParser
13
9
from datetime import datetime
14
10
import json
15
11
import os
16
12
import re
17
13
from tempfile import NamedTemporaryFile
18
14
import yaml
19
15
20
16
from utility import (
21
17
    s3_cmd,
22
18
    temp_dir,
23
19
)
24
20
25
21
ARCHIVE_URL = 's3://juju-qa-data/juju-ci/products/'
26
22
ISO_8601_FORMAT = '%Y-%m-%dT%H:%M:%S.%fZ'
27
23
LONG_AGO = datetime(2000, 1, 1)
28
24
29
25
30
26
def get_ci_director_state():
31
27
    state_file_path = os.path.join(
32
28
        os.environ['HOME'], '.config/ci-director-state')
33
29
    with open(state_file_path) as state_file:
34
30
        return yaml.load(state_file)['versions']
35
31
36
32
37
33
def list_s3_files():
38
34
    text = s3_cmd(['ls', '-r', ARCHIVE_URL])
39
35
    for line in text.strip().split('\n'):
40
36
        file_date, file_time, size, url = re.split(r'\s+', line)
41
37
        file_date = [int(part) for part in file_date.split('-')]
42
38
        file_time = [int(part) for part in file_time.split(':')]
43
39
        file_time = datetime(*(file_date + file_time))
44
40
        revision_number, filename = re.search(
45
41
            r'^{}version-(\d+)/(.*)$'.format(ARCHIVE_URL), url).groups()
46
42
        yield int(revision_number), filename, file_time
47
43
48
44
49
45
def get_s3_revision_info():
50
46
    all_revisions = {}
51
47
    for revision_number, file_name, file_time in list_s3_files():
52
48
        revision = all_revisions.setdefault(revision_number, {
53
49
            'result': {},
54
50
            'artifact_time': LONG_AGO,
55
51
            })
56
52
        if file_name in ('result.yaml', 'result.json'):
57
53
            # Many result.json files were added on 2014-08-14 for older
58
54
            # builds, so we may have both a result.yaml file and a
59
55
            # result.json file.
60
56
            revision['result'][file_time] = file_name
61
57
        else:
62
58
            revision['artifact_time'] = max(
63
59
                revision['artifact_time'], file_time)
64
60
    # The most recent version may currently be building, hence a check
65
61
    # if the result file exists is useless.
66
62
    del all_revisions[max(all_revisions)]
67
63
    result_file_time = revision['artifact_time']
68
64
    for revision_number, revision_data in sorted(all_revisions.items()):
69
65
        if not revision_data['result']:
70
66
            result_file_name = None
71
67
        else:
72
68
            result_file_time = min(revision_data['result'])
73
69
            # If both a result.yaml and a result.json file exist, use
74
70
            # the newer one.
75
71
            newer = max(revision_data['result'])
76
72
            result_file_name = revision_data['result'][newer]
77
73
        yield revision_number, result_file_name, result_file_time
78
74
79
75
def main(args):
80
76
    ci_director_state = get_ci_director_state()
81
77
    for revision_number, result_file, artifact_time in get_s3_revision_info():
82
78
        state_file_result = ci_director_state.get(revision_number)
83
79
        if state_file_result is None:
84
80
            print(
85
81
                "Warning: No state file data available for revision",
86
82
                revision_number)
87
83
            continue
88
84
        if result_file is not None:
89
85
            with temp_dir() as workspace:
90
86
                copy_from = '{}version-{}/{}'.format(
91
87
                    ARCHIVE_URL, revision_number, result_file)
92
88
                copy_to = os.path.join(workspace, result_file)
93
89
                s3_cmd(['--no-progress', 'get', copy_from, copy_to])
94
90
                with open(copy_to) as f:
95
91
                    s3_result = yaml.load(f)
96
92
                # For paranoids: Check that the data from S3 is a subset
97
93
                # of the data from the state file
98
94
                s3_keys = set(s3_result)
99
95
                state_keys = set(ci_director_state[revision_number])
100
96
                if not s3_keys.issubset(state_keys):
101
97
                    print(
102
98
                        "Warning: S3 result file for {} contains keys that do "
103
99
                        "not exist in the main state file: {}".format(
104
100
                            revision_number, s3_keys.difference(state_keys)))
105
101
                    continue
106
102
                comparable_state_data = dict(
107
103
                    (k, v)
108
104
                    for k, v in ci_director_state[revision_number].items()
109
105
                    if k in s3_keys)
110
106
                if comparable_state_data != s3_result:
111
107
                    # This can happen when the result file was written
112
108
                    # when a -devel job is still running.
113
109
                    print(
114
110
                        "Warning: Diverging data for revision {} in S3 ({}) "
115
111
                        "and in state file ({}).".format(
116
112
                            revision_number, s3_result,
117
113
                            ci_director_state[revision_number]))
118
114
                if 'result' in s3_result:
119
115
                    continue
120
116
121
117
        if 'finished' not in state_file_result:
122
118
            state_file_result['finished'] = artifact_time.strftime(
123
119
                ISO_8601_FORMAT)
124
120
        with NamedTemporaryFile() as new_result_file:
125
121
            json.dump(state_file_result, new_result_file)
126
122
            new_result_file.flush()
127
123
            dest_url = '{}version-{}/result.json'.format(
128
124
                ARCHIVE_URL, revision_number)
129
125
            params = ['put', new_result_file.name, dest_url]
130
126
            if args.dry_run:
131
127
                print(*(['s3cmd'] + params))
132
128
            else:
133
129
                s3_cmd(params)
134
130
135
131
if __name__ == '__main__':
136
132
    parser = ArgumentParser()
137
133
    parser.add_argument('--dry-run', action='store_true')
138
134
    args = parser.parse_args()
139
135
    main(args)
140
0
136
141
=== modified file 'backup-to-s3.py'
142
--- backup-to-s3.py	2014-07-25 12:02:32 +0000
143
+++ backup-to-s3.py	2014-09-26 15:12:24 +0000
144
@@ -6,6 +6,8 @@
145
6
import re
6
import re
146
7
import subprocess
7
import subprocess
147
8
8
148
9
from utility import s3_cmd
149
10
150
9
11
151
10
MAX_BACKUPS = 10
12
MAX_BACKUPS = 10
152
11
BACKUP_URL = 's3://juju-qa-data/juju-ci/backups/'
13
BACKUP_URL = 's3://juju-qa-data/juju-ci/backups/'
153
@@ -26,17 +28,6 @@
154
26
    ]
28
    ]
155
27
29
156
28
30
157
29
def s3_cmd(params, drop_output=False):
158
30
    s3cfg_path = os.path.join(
159
31
        os.environ['HOME'], 'cloud-city/juju-qa.s3cfg')
160
32
    if drop_output:
161
33
        return subprocess.check_call(
162
34
            ['s3cmd', '-c', s3cfg_path] + params, stdout=open('/dev/null', 'w'))
163
35
    else:
164
36
        return subprocess.check_output(
165
37
            ['s3cmd', '-c', s3cfg_path] + params)
166
38
167
39
168
40
def current_backups():
31
def current_backups():
169
41
    """Return a list of S3 URLs of existing backups."""
32
    """Return a list of S3 URLs of existing backups."""
170
42
    # We expect lines like
33
    # We expect lines like
171
43
34
172
=== modified file 'utility.py'
173
--- utility.py	2014-09-20 00:05:37 +0000
174
+++ utility.py	2014-09-26 15:12:24 +0000
175
@@ -133,3 +133,14 @@
176
133
            'path': path, 'mount': df_result[5], 'required': required,
133
            'path': path, 'mount': df_result[5], 'required': required,
177
134
            'available': available, 'purpose': purpose
134
            'available': available, 'purpose': purpose
178
135
            })
135
            })
179
136
180
137
181
138
def s3_cmd(params, drop_output=False):
182
139
    s3cfg_path = os.path.join(
183
140
        os.environ['HOME'], 'cloud-city/juju-qa.s3cfg')
184
141
    command = ['s3cmd', '-c', s3cfg_path, '--no-progress'] + params
185
142
    if drop_output:
186
143
        return subprocess.check_call(
187
144
            command, stdout=open('/dev/null', 'w'))
188
145
    else:
189
146
        return subprocess.check_output(command)
Status:	Merged
Merged at revision:	692
Proposed branch:	lp:~adeuring/juju-ci-tools/add-missing-results-files-to-s3
Merge into:	lp:juju-ci-tools
Diff against target:	189 lines (+148/-11) 3 files modified add-missing-result-yaml-files.py (+135/-0) backup-to-s3.py (+2/-11) utility.py (+11/-0)
To merge this branch:	bzr merge lp:~adeuring/juju-ci-tools/add-missing-results-files-to-s3
Related bugs:	Link a bug report
Reviewer	Review Type	Date Requested	Status
Curtis Hovey (community)	code	2014-09-25	Approve on 2014-09-26
Review via email: mp+236008@code.launchpad.net