pydata · shoyer · Jul 7, 2017 · Jul 10, 2017 · Jul 12, 2017 · Jul 15, 2017
diff --git a/xarray/core/variable.py b/xarray/core/variable.py
@@ -28,6 +28,7 @@
     pass
 
 
+
 def as_variable(obj, name=None):
     """Convert an object into a Variable.
 
@@ -406,6 +407,96 @@ def __getitem__(self, key):
         return type(self)(dims, values, self._attrs, self._encoding,
                           fastpath=True)
 
+    def _broadcast_indexes(self, key):
+        """
+        Parameters
+        -----------
+        key: One of
+            array
+            a mapping of dimension names to index.
+
+        Returns
+        -------
+        dims: Tuple of strings.
+            Dimension of the resultant variable.
+        indexers: list of integer, array-like, or slice. This is aligned
+            along self.dims.
+        """
+        if not utils.is_dict_like(key):
+            key = {self.dims[0]: key}
+        example_v = None
+        indexes = OrderedDict()
+        for k, v in key.items():
+            if not isinstance(v, (integer_types, slice, Variable)):
+                if not hasattr(key, 'ndim'):  # convert list or tuple
+                    v = np.array(v)
+            if example_v is None and isinstance(v, Variable):
+                example_v = v
+            indexes[k] = v
+
+        # When all the keys are array or integer, slice
+        if example_v is None:
+            # more than one (unlabelled) arrays
+            if len([v for k, v in indexes.items()
+                    if not isinstance(v, (integer_types, slice))]) > 1:
+                raise IndexError("Indexing with multiple unlabelled arrays "
+                                 "is not allowed.")
+            # multi-dimensional unlabelled array
+            if any([v.ndim > 1 for k, v in indexes.items()
+                    if not isinstance(v, integer_types)]):
+                raise IndexError("Indexing with a multi-dimensional unlabelled"
+                                 "array is not allowed.")
+            # convert the array into Variable
+            for k, v in indexes.items():
+                if not hasattr(v, 'dims'):
+                    indexes[k] = type(self)([k], v)
+                    example_v = v
+
+        for k, v in indexes.items():
+            # Found unlabelled array
+            if not isinstance(v, (Variable, integer_types, slice)):
+                if (v.ndim > example_v.ndim or
+                        any([example_v.ndim != v.ndim for k, v
+                             in indexes.items() if isinstance(v, Variable)])):
+                    raise IndexError("Broadcasting failed because dimensions "
+                                     "does not match.")
+                else:
+                    _, indexes[k], _ = _broadcast_compat_data(example_v, v)
+
+        index_tuple = tuple(indexes.get(d, slice(None)) for d in self.dims)
+        index_tuple = indexing.expanded_indexer(index_tuple, self.ndim)
+
+        # comput dims
+        dims = []
+        for i, d in enumerate(self.dims):
+            if d in indexes.keys():
+                if isinstance(v, Variable):
+                    for d in v.dims:
+                        if d not in dims:
+                            dims.append(d)
+            else:
+                dims.append(d)
+
+        return dims, index_tuple
+
+    def getitem2(self, key):
+        """Return a new Array object whose contents are consistent with
+        getting the provided key from the underlying data.
+
+        NB. __getitem__ and __setitem__ implement "diagonal indexing" like
+        np.ndarray.
+
+        This method will replace __getitem__ after we make sure its stability.
+        """
+        dims, index_tuple = self._broadcast_indexes(key)
+        values = self._data[index_tuple]
+        if hasattr(values, 'ndim'):
+            assert values.ndim == len(dims), (values.ndim, len(dims))
+        else:
+            assert len(dims) == 0, len(dims)
+        return type(self)(dims, values, self._attrs, self._encoding,
+                          fastpath=True)
+
     def __setitem__(self, key, value):
         """__setitem__ is overloaded to access the underlying numpy values with
         orthogonal indexing.

diff --git a/xarray/tests/test_variable.py b/xarray/tests/test_variable.py
@@ -709,6 +709,76 @@ def test_items(self):
         v[range(10), range(11)] = 1
         self.assertArrayEqual(v.values, np.ones((10, 11)))
 
+    def test_getitem2(self):
+        v = self.cls(['x', 'y'], [[0, 1, 2], [3, 4, 5]])
+
+        with self.assertRaisesRegexp(IndexError, "Indexing with multiple"):
+            v.getitem2(dict(x=[0, 1], y=[0, 1]))
+
+        with self.assertRaisesRegexp(IndexError, "Indexing with a multi-"):
+            v.getitem2([[0, 1], [1, 2]])
+
+        dims, index_tuple = v._broadcast_indexes([0, 1])
+        self.assertTrue(dims == ['x', 'y'])
+        self.assertTrue(np.allclose(index_tuple[0], [0, 1]))
+        self.assertTrue(index_tuple[1] == slice(None, None, None))
+        v_new = v.getitem2([0, 1])
+        self.assertTrue(v_new.dims == ('x', 'y'))
+        self.assertArrayEqual(v_new, v._data[[0, 1]])
+
+        ind = Variable(['a', 'b'], [[0, 1, 1], [1, 1, 0]])
+        dims, index_tuple = v._broadcast_indexes(ind)
+        self.assertTrue(dims == ['a', 'b', 'y'])
+        self.assertTrue(np.allclose(index_tuple[0], [[0, 1, 1], [1, 1, 0]]))
+        self.assertTrue(index_tuple[1] == slice(None, None, None))
+        v_new = v.getitem2(ind)
+        self.assertTrue(v_new.dims == ('a', 'b', 'y'))
+        self.assertArrayEqual(v_new, v._data[([0, 1, 1], [1, 1, 0]), :])
+
+        ind = Variable(['a', 'b'], [[0, 1, 2], [2, 1, 0]])
+        dims, index_tuple = v._broadcast_indexes(dict(y=ind))
+        self.assertTrue(dims == ['x', 'a', 'b'])
+        self.assertTrue(len(index_tuple) == 2)
+        self.assertTrue(index_tuple[0] == slice(None, None, None))
+        self.assertTrue(np.allclose(index_tuple[1], [[0, 1, 2], [2, 1, 0]]))
+        v_new = v.getitem2(dict(y=ind))
+        self.assertTrue(v_new.dims == ('x', 'a', 'b'))
+        self.assertArrayEqual(v_new, v._data[:, ([0, 1, 2], [2, 1, 0])])
+
+        # with broadcast
+        ind = Variable(['a'], [0, 1])
+        dims, index_tuple = v._broadcast_indexes(dict(x=[0, 1], y=ind))
+        self.assertTrue(dims == ['a'])
+        self.assertTrue(np.allclose(index_tuple[0], [0, 1]))
+        self.assertTrue(np.allclose(index_tuple[1], [0, 1]))
+        v_new = v.getitem2(dict(x=[0, 1], y=ind))
+        self.assertArrayEqual(v_new, v._data[[0, 1], [0, 1]])
+
+        ind = Variable(['a', 'b'], [[0, 0], [1, 1]])
+        dims, index_tuple = v._broadcast_indexes(dict(x=[[1, 0], [1, 0]],
+                                                      y=ind))
+        self.assertTrue(dims == ['a', 'b'])
+        self.assertTrue(np.allclose(index_tuple[0], [[1, 0], [1, 0]]))
+        self.assertTrue(np.allclose(index_tuple[1], [[0, 0], [1, 1]]))
+        v_new = v.getitem2(dict(x=[[1, 0], [1, 0]], y=ind))
+        self.assertArrayEqual(v_new,
+                              v._data[([1, 0], [1, 0]), ([0, 0], [1, 1])])
+
+        # broadcast impossible case
+        with self.assertRaisesRegexp(IndexError, "Broadcasting failed "):
+            ind = Variable(['a'], [0, 1])
+            v.getitem2(dict(x=[[1, 0], [1, 0]], y=ind))
+
+        # with integer
+        ind = Variable(['a', 'b'], [[0, 0], [1, 1]])
+        dims, index_tuple = v._broadcast_indexes(dict(x=0, y=ind))
+        self.assertTrue(dims == ['a', 'b'])
+        self.assertTrue(np.allclose(index_tuple[0], 0))
+        self.assertTrue(np.allclose(index_tuple[1], [[0, 0], [1, 1]]))
+        v_new = v.getitem2(dict(x=0, y=ind))
+        self.assertArrayEqual(v_new,
+                              v._data[0, ([0, 0], [1, 1])])
+
     def test_isel(self):
         v = Variable(['time', 'x'], self.d)
         self.assertVariableIdentical(v.isel(time=slice(None)), v)