1
=== modified file 'bzrlib/chk_map.py'
2
--- bzrlib/chk_map.py	2009-05-13 21:59:57 +0000
3
+++ bzrlib/chk_map.py	2009-06-15 15:35:24 +0000
4
@@ -121,7 +121,7 @@
5
121
121
6
122
    def _ensure_root(self):
122
    def _ensure_root(self):
7
123
        """Ensure that the root node is an object not a key."""
123
        """Ensure that the root node is an object not a key."""
9
124
        if type(self._root_node) == tuple:
124
        if type(self._root_node) is tuple:
10
125
            # Demand-load the root
125
            # Demand-load the root
11
126
            self._root_node = self._get_node(self._root_node)
126
            self._root_node = self._get_node(self._root_node)
12
127
127
13
@@ -135,7 +135,7 @@
14
135
        :param node: A tuple key or node object.
135
        :param node: A tuple key or node object.
15
136
        :return: A node object.
136
        :return: A node object.
16
137
        """
137
        """
18
138
        if type(node) == tuple:
138
        if type(node) is tuple:
19
139
            bytes = self._read_bytes(node)
139
            bytes = self._read_bytes(node)
20
140
            return _deserialise(bytes, node,
140
            return _deserialise(bytes, node,
21
141
                search_key_func=self._search_key_func)
141
                search_key_func=self._search_key_func)
22
@@ -465,7 +465,7 @@
23
465
465
24
466
    def _node_key(self, node):
466
    def _node_key(self, node):
25
467
        """Get the key for a node whether it's a tuple or node."""
467
        """Get the key for a node whether it's a tuple or node."""
27
468
        if type(node) == tuple:
468
        if type(node) is tuple:
28
469
            return node
469
            return node
29
470
        else:
470
        else:
30
471
            return node._key
471
            return node._key
31
@@ -491,7 +491,7 @@
32
491
491
33
492
        :return: The key of the root node.
492
        :return: The key of the root node.
34
493
        """
493
        """
36
494
        if type(self._root_node) == tuple:
494
        if type(self._root_node) is tuple:
37
495
            # Already saved.
495
            # Already saved.
38
496
            return self._root_node
496
            return self._root_node
39
497
        keys = list(self._root_node.serialise(self._store))
497
        keys = list(self._root_node.serialise(self._store))
40
@@ -955,34 +955,99 @@
41
955
        # prefix is the key in self._items to use, key_filter is the key_filter
955
        # prefix is the key in self._items to use, key_filter is the key_filter
42
956
        # entries that would match this node
956
        # entries that would match this node
43
957
        keys = {}
957
        keys = {}
44
958
        shortcut = False
45
958
        if key_filter is None:
959
        if key_filter is None:
46
960
            # yielding all nodes, yield whatever we have, and queue up a read
47
961
            # for whatever we are missing
48
962
            shortcut = True
49
959
            for prefix, node in self._items.iteritems():
963
            for prefix, node in self._items.iteritems():
51
960
                if type(node) == tuple:
964
                if node.__class__ is tuple:
52
961
                    keys[node] = (prefix, None)
965
                    keys[node] = (prefix, None)
53
962
                else:
966
                else:
54
963
                    yield node, None
967
                    yield node, None
57
964
        else:
968
        elif len(key_filter) == 1:
58
965
            # XXX defaultdict ?
969
            # Technically, this path could also be handled by the first check
59
970
            # in 'self._node_width' in length_filters. However, we can handle
60
971
            # this case without spending any time building up the
61
972
            # prefix_to_keys, etc state.
62
973
63
974
            # This is a bit ugly, but TIMEIT showed it to be by far the fastest
64
975
            # 0.626us   list(key_filter)[0]
65
976
            #       is a func() for list(), 2 mallocs, and a getitem
66
977
            # 0.489us   [k for k in key_filter][0]
67
978
            #       still has the mallocs, avoids the func() call
68
979
            # 0.350us   iter(key_filter).next()
69
980
            #       has a func() call, and mallocs an iterator
70
981
            # 0.125us   for key in key_filter: pass
71
982
            #       no func() overhead, might malloc an iterator
72
983
            # 0.105us   for key in key_filter: break
73
984
            #       no func() overhead, might malloc an iterator, probably
74
985
            #       avoids checking an 'else' clause as part of the for
75
986
            for key in key_filter:
76
987
                break
77
988
            search_prefix = self._search_prefix_filter(key)
78
989
            if len(search_prefix) == self._node_width:
79
990
                # This item will match exactly, so just do a dict lookup, and
80
991
                # see what we can return
81
992
                shortcut = True
82
993
                try:
83
994
                    node = self._items[search_prefix]
84
995
                except KeyError:
85
996
                    # A given key can only match 1 child node, if it isn't
86
997
                    # there, then we can just return nothing
87
998
                    return
88
999
                if node.__class__ is tuple:
89
1000
                    keys[node] = (search_prefix, [key])
90
1001
                else:
91
1002
                    # This is loaded, and the only thing that can match,
92
1003
                    # return
93
1004
                    yield node, [key]
94
1005
                    return
95
1006
        if not shortcut:
96
1007
            # First, convert all keys into a list of search prefixes
97
1008
            # Aggregate common prefixes, and track the keys they come from
98
966
            prefix_to_keys = {}
1009
            prefix_to_keys = {}
99
967
            length_filters = {}
1010
            length_filters = {}
100
968
            for key in key_filter:
1011
            for key in key_filter:
102
969
                search_key = self._search_prefix_filter(key)
1012
                search_prefix = self._search_prefix_filter(key)
103
970
                length_filter = length_filters.setdefault(
1013
                length_filter = length_filters.setdefault(
117
971
                                    len(search_key), set())
1014
                                    len(search_prefix), set())
118
972
                length_filter.add(search_key)
1015
                length_filter.add(search_prefix)
119
973
                prefix_to_keys.setdefault(search_key, []).append(key)
1016
                prefix_to_keys.setdefault(search_prefix, []).append(key)
120
974
            length_filters = length_filters.items()
1017
121
975
            for prefix, node in self._items.iteritems():
1018
            if (self._node_width in length_filters
122
976
                node_key_filter = []
1019
                and len(length_filters) == 1):
123
977
                for length, length_filter in length_filters:
1020
                # all of the search prefixes match exactly _node_width. This
124
978
                    sub_prefix = prefix[:length]
1021
                # means that everything is an exact match, and we can do a
125
979
                    if sub_prefix in length_filter:
1022
                # lookup into self._items, rather than iterating over the items
126
980
                        node_key_filter.extend(prefix_to_keys[sub_prefix])
1023
                # dict.
127
981
                if node_key_filter: # this key matched something, yield it
1024
                search_prefixes = length_filters[self._node_width]
128
982
                    if type(node) == tuple:
1025
                for search_prefix in search_prefixes:
129
983
                        keys[node] = (prefix, node_key_filter)
1026
                    try:
130
1027
                        node = self._items[search_prefix]
131
1028
                    except KeyError:
132
1029
                        # We can ignore this one
133
1030
                        continue
134
1031
                    node_key_filter = prefix_to_keys[search_prefix]
135
1032
                    if node.__class__ is tuple:
136
1033
                        keys[node] = (search_prefix, node_key_filter)
137
984
                    else:
1034
                    else:
138
985
                        yield node, node_key_filter
1035
                        yield node, node_key_filter
139
1036
            else:
140
1037
                # The slow way. We walk every item in self._items, and check to
141
1038
                # see if there are any matches
142
1039
                length_filters = length_filters.items()
143
1040
                for prefix, node in self._items.iteritems():
144
1041
                    node_key_filter = []
145
1042
                    for length, length_filter in length_filters:
146
1043
                        sub_prefix = prefix[:length]
147
1044
                        if sub_prefix in length_filter:
148
1045
                            node_key_filter.extend(prefix_to_keys[sub_prefix])
149
1046
                    if node_key_filter: # this key matched something, yield it
150
1047
                        if node.__class__ is tuple:
151
1048
                            keys[node] = (prefix, node_key_filter)
152
1049
                        else:
153
1050
                            yield node, node_key_filter
154
986
        if keys:
1051
        if keys:
155
987
            # Look in the page cache for some more bytes
1052
            # Look in the page cache for some more bytes
156
988
            found_keys = set()
1053
            found_keys = set()
157
@@ -1117,7 +1182,7 @@
158
1117
        :return: An iterable of the keys inserted by this operation.
1182
        :return: An iterable of the keys inserted by this operation.
159
1118
        """
1183
        """
160
1119
        for node in self._items.itervalues():
1184
        for node in self._items.itervalues():
162
1120
            if type(node) == tuple:
1185
            if type(node) is tuple:
163
1121
                # Never deserialised.
1186
                # Never deserialised.
164
1122
                continue
1187
                continue
165
1123
            if node._key is not None:
1188
            if node._key is not None:
166
@@ -1134,7 +1199,7 @@
167
1134
        lines.append('%s\n' % (self._search_prefix,))
1199
        lines.append('%s\n' % (self._search_prefix,))
168
1135
        prefix_len = len(self._search_prefix)
1200
        prefix_len = len(self._search_prefix)
169
1136
        for prefix, node in sorted(self._items.items()):
1201
        for prefix, node in sorted(self._items.items()):
171
1137
            if type(node) == tuple:
1202
            if type(node) is tuple:
172
1138
                key = node[0]
1203
                key = node[0]
173
1139
            else:
1204
            else:
174
1140
                key = node._key[0]
1205
                key = node._key[0]
175
@@ -1179,7 +1244,7 @@
176
1179
            raise AssertionError("unserialised nodes have no refs.")
1244
            raise AssertionError("unserialised nodes have no refs.")
177
1180
        refs = []
1245
        refs = []
178
1181
        for value in self._items.itervalues():
1246
        for value in self._items.itervalues():
180
1182
            if type(value) == tuple:
1247
            if type(value) is tuple:
181
1183
                refs.append(value)
1248
                refs.append(value)
182
1184
            else:
1249
            else:
183
1185
                refs.append(value.key())
1250
                refs.append(value.key())
184
1186
1251
185
=== modified file 'bzrlib/tests/test_chk_map.py'
186
--- bzrlib/tests/test_chk_map.py	2009-05-13 21:59:57 +0000
187
+++ bzrlib/tests/test_chk_map.py	2009-06-15 15:35:24 +0000
188
@@ -1560,13 +1560,66 @@
189
1560
        child.map(None, ("baz",), "val")
1560
        child.map(None, ("baz",), "val")
190
1561
        node.add_node("b", child)
1561
        node.add_node("b", child)
191
1562
1562
193
1563
        key_filter = (('foo',), ('fob',), ('bar',), ('baz',))
1563
        # Note that 'ram' doesn't match anything, so it should be freely
194
1564
        # ignored
195
1565
        key_filter = (('foo',), ('fob',), ('bar',), ('baz',), ('ram',))
196
1564
        for child, node_key_filter in node._iter_nodes(None,
1566
        for child, node_key_filter in node._iter_nodes(None,
197
1565
                                                       key_filter=key_filter):
1567
                                                       key_filter=key_filter):
199
1566
            # each child could matches two key filters, so make sure they were
1568
            # each child could match two key filters, so make sure they were
200
1567
            # both included.
1569
            # both included.
201
1568
            self.assertEqual(2, len(node_key_filter))
1570
            self.assertEqual(2, len(node_key_filter))
202
1569
1571
203
1572
    def make_fo_fa_node(self):
204
1573
        node = InternalNode('f')
205
1574
        child = LeafNode()
206
1575
        child.set_maximum_size(100)
207
1576
        child.map(None, ("foo",), "val")
208
1577
        child.map(None, ("fob",), "val")
209
1578
        node.add_node('fo', child)
210
1579
        child = LeafNode()
211
1580
        child.set_maximum_size(100)
212
1581
        child.map(None, ("far",), "val")
213
1582
        child.map(None, ("faz",), "val")
214
1583
        node.add_node("fa", child)
215
1584
        return node
216
1585
217
1586
    def test__iter_nodes_single_entry(self):
218
1587
        node = self.make_fo_fa_node()
219
1588
        key_filter = [('foo',)]
220
1589
        nodes = list(node._iter_nodes(None, key_filter=key_filter))
221
1590
        self.assertEqual(1, len(nodes))
222
1591
        self.assertEqual(key_filter, nodes[0][1])
223
1592
224
1593
    def test__iter_nodes_single_entry_misses(self):
225
1594
        node = self.make_fo_fa_node()
226
1595
        key_filter = [('bar',)]
227
1596
        nodes = list(node._iter_nodes(None, key_filter=key_filter))
228
1597
        self.assertEqual(0, len(nodes))
229
1598
230
1599
    def test__iter_nodes_mixed_key_width(self):
231
1600
        node = self.make_fo_fa_node()
232
1601
        key_filter = [('foo', 'bar'), ('foo',), ('fo',), ('b',)]
233
1602
        nodes = list(node._iter_nodes(None, key_filter=key_filter))
234
1603
        self.assertEqual(1, len(nodes))
235
1604
        matches = key_filter[:]
236
1605
        matches.remove(('b',))
237
1606
        self.assertEqual(sorted(matches), sorted(nodes[0][1]))
238
1607
239
1608
    def test__iter_nodes_match_all(self):
240
1609
        node = self.make_fo_fa_node()
241
1610
        key_filter = [('foo', 'bar'), ('foo',), ('fo',), ('f',)]
242
1611
        nodes = list(node._iter_nodes(None, key_filter=key_filter))
243
1612
        self.assertEqual(2, len(nodes))
244
1613
245
1614
    def test__iter_nodes_fixed_widths_and_misses(self):
246
1615
        node = self.make_fo_fa_node()
247
1616
        # foo and faa should both match one child, baz should miss
248
1617
        key_filter = [('foo',), ('faa',), ('baz',)]
249
1618
        nodes = list(node._iter_nodes(None, key_filter=key_filter))
250
1619
        self.assertEqual(2, len(nodes))
251
1620
        for node, matches in nodes:
252
1621
            self.assertEqual(1, len(matches))
253
1622
254
1570
    def test_iteritems_empty_new(self):
1623
    def test_iteritems_empty_new(self):
255
1571
        node = InternalNode()
1624
        node = InternalNode()
256
1572
        self.assertEqual([], sorted(node.iteritems(None)))
1625
        self.assertEqual([], sorted(node.iteritems(None)))
257
1573
1626
258
=== modified file 'bzrlib/workingtree.py'
259
--- bzrlib/workingtree.py	2009-06-10 03:56:49 +0000
260
+++ bzrlib/workingtree.py	2009-06-15 15:35:24 +0000
261
@@ -451,7 +451,7 @@
262
451
            path = self.id2path(file_id)
451
            path = self.id2path(file_id)
263
452
        file_obj = self.get_file_byname(path, filtered=False)
452
        file_obj = self.get_file_byname(path, filtered=False)
264
453
        stat_value = _fstat(file_obj.fileno())
453
        stat_value = _fstat(file_obj.fileno())
266
454
        if self.supports_content_filtering() and filtered:
454
        if filtered and self.supports_content_filtering():
267
455
            filters = self._content_filter_stack(path)
455
            filters = self._content_filter_stack(path)
268
456
            file_obj = filtered_input_file(file_obj, filters)
456
            file_obj = filtered_input_file(file_obj, filters)
269
457
        return (file_obj, stat_value)
457
        return (file_obj, stat_value)
270
@@ -462,7 +462,7 @@
271
462
    def get_file_byname(self, filename, filtered=True):
462
    def get_file_byname(self, filename, filtered=True):
272
463
        path = self.abspath(filename)
463
        path = self.abspath(filename)
273
464
        f = file(path, 'rb')
464
        f = file(path, 'rb')
275
465
        if self.supports_content_filtering() and filtered:
465
        if filtered and self.supports_content_filtering():
276
466
            filters = self._content_filter_stack(filename)
466
            filters = self._content_filter_stack(filename)
277
467
            return filtered_input_file(f, filters)
467
            return filtered_input_file(f, filters)
278
468
        else:
468
        else:
Status:	Merged
Approved by:	Ian Clatworthy on 2009-06-15
Approved revision:	no longer in the source branch.
Merged at revision:	not available
Proposed branch:	lp:~jameinel/bzr/1.16-chkmap-updates
Merge into:	lp:~bzr/bzr/trunk-old
Diff against target:	278 lines
To merge this branch:	bzr merge lp:~jameinel/bzr/1.16-chkmap-updates
Related bugs:	Link a bug report
Reviewer	Review Type	Date Requested	Status
Ian Clatworthy		2009-06-05	Approve on 2009-06-15
Review via email: mp+7113@code.launchpad.net