pandas-dev · jbrockmendel · Sep 29, 2020 · Oct 1, 2020 · Sep 29, 2020 · Oct 3, 2020
diff --git a/pandas/core/arrays/datetimelike.py b/pandas/core/arrays/datetimelike.py
@@ -1595,6 +1595,24 @@ def _with_freq(self, freq):
 # Shared Constructor Helpers
 
 
+def ensure_arraylike(scalars, copy: bool) -> Tuple[Any, bool]:
+    """
+    Convert non-arraylike scalar sequences to ndarray.
+    """
+    if not hasattr(scalars, "dtype"):
+        copy = False
+        if np.ndim(scalars) == 0:
+            scalars = list(scalars)
+
+        scalars = np.asarray(scalars)
+        if len(scalars) == 0:
+            # Without casting, we would have float64 and so would reject later
+            #  in from_sequence
+            scalars = scalars.astype(object)
+
+    return scalars, copy
+
+
 def validate_periods(periods):
     """
     If a `periods` argument is passed to the Datetime/Timedelta Array/Index

diff --git a/pandas/core/arrays/datetimes.py b/pandas/core/arrays/datetimes.py
@@ -43,7 +43,12 @@
     pandas_dtype,
 )
 from pandas.core.dtypes.dtypes import DatetimeTZDtype
-from pandas.core.dtypes.generic import ABCIndexClass, ABCPandasArray, ABCSeries
+from pandas.core.dtypes.generic import (
+    ABCIndexClass,
+    ABCMultiIndex,
+    ABCPandasArray,
+    ABCSeries,
+)
 from pandas.core.dtypes.missing import isna
 
 from pandas.core.algorithms import checked_add_with_arr
@@ -302,6 +307,34 @@ def _simple_new(
 
     @classmethod
     def _from_sequence(cls, scalars, dtype=None, copy: bool = False):
+
+        scalars, copy = dtl.ensure_arraylike(scalars, copy)
+
+        if scalars.dtype.kind == "M":
+            pass
+        elif scalars.dtype == object:
+            if isinstance(scalars, ABCMultiIndex):
+                raise TypeError("Cannot create a DatetimeArray from MultiIndex")
+
+            inferred = lib.infer_dtype(scalars)
+            if inferred in ["datetime64", "date", "datetime", "empty"]:
+                pass
+            else:
+                msg = f"{inferred} scalars cannot be converted to datetime64[ns]"
+                raise TypeError(msg)
+        elif is_string_dtype(scalars.dtype):
+            # TODO: should go through from_sequence_of_strings?
+            pass
+        elif (
+            is_categorical_dtype(scalars.dtype) and scalars.categories.dtype.kind == "M"
+        ):
+            # TODO: Could also use Categorical[object]
+            #  with inferred_type as above?
+            pass
+        else:
+            msg = f"dtype {scalars.dtype} cannot be converted to datetime64[ns]"
+            raise TypeError(msg)
+
         return cls._from_sequence_not_strict(scalars, dtype=dtype, copy=copy)
 
     @classmethod

diff --git a/pandas/core/arrays/timedeltas.py b/pandas/core/arrays/timedeltas.py
@@ -224,6 +224,22 @@ def _from_sequence(
         if dtype:
             _validate_td64_dtype(dtype)
 
+        data, copy = dtl.ensure_arraylike(data, copy)
+
+        if data.dtype.kind == "m":
+            pass
+        elif data.dtype == object:
+            inferred = lib.infer_dtype(data)
+            if inferred in ["timedelta64", "timedelta", "empty"]:
+                pass
+            else:
+                raise TypeError(inferred)
+        elif is_string_dtype(data.dtype):
+            # TODO: should go through from_sequence_of_strings?
+            pass
+        else:
+            raise TypeError(data.dtype)
+
         data, inferred_freq = sequence_to_td64ns(data, copy=copy, unit=None)
         freq, _ = dtl.validate_inferred_freq(None, inferred_freq, False)
 

diff --git a/pandas/tests/arithmetic/test_period.py b/pandas/tests/arithmetic/test_period.py
@@ -1189,7 +1189,7 @@ def test_parr_add_sub_td64_nat(self, box_with_array, transpose):
         "other",
         [
             np.array(["NaT"] * 9, dtype="m8[ns]"),
-            TimedeltaArray._from_sequence(["NaT"] * 9),
+            TimedeltaArray._from_sequence([np.timedelta64("NaT", "ns")] * 9),
         ],
     )
     def test_parr_add_sub_tdt64_nat_array(self, box_with_array, other):

diff --git a/pandas/tests/arrays/test_array.py b/pandas/tests/arrays/test_array.py
@@ -48,7 +48,7 @@
         (
             [pd.Period("2000", "D"), pd.Period("2001", "D")],
             "Period[D]",
-            period_array(["2000", "2001"], freq="D"),
+            period_array([pd.Timestamp("2000"), pd.Timestamp("2001")], freq="D"),
         ),
         # Period dtype
         (
@@ -57,11 +57,6 @@
             period_array(["2000"], freq="D"),
         ),
         # Datetime (naive)
-        (
-            [1, 2],
-            np.dtype("datetime64[ns]"),
-            DatetimeArray._from_sequence(np.array([1, 2], dtype="datetime64[ns]")),
-        ),
         (
             np.array([1, 2], dtype="datetime64[ns]"),
             None,
@@ -70,41 +65,42 @@
         (
             pd.DatetimeIndex(["2000", "2001"]),
             np.dtype("datetime64[ns]"),
-            DatetimeArray._from_sequence(["2000", "2001"]),
+            DatetimeArray._from_sequence([pd.Timestamp("2000"), pd.Timestamp("2001")]),
         ),
         (
             pd.DatetimeIndex(["2000", "2001"]),
             None,
-            DatetimeArray._from_sequence(["2000", "2001"]),
+            DatetimeArray._from_sequence([pd.Timestamp("2000"), pd.Timestamp("2001")]),
         ),
         (
             ["2000", "2001"],
             np.dtype("datetime64[ns]"),
-            DatetimeArray._from_sequence(["2000", "2001"]),
+            DatetimeArray._from_sequence([pd.Timestamp("2000"), pd.Timestamp("2001")]),
         ),
         # Datetime (tz-aware)
         (
             ["2000", "2001"],
             pd.DatetimeTZDtype(tz="CET"),
             DatetimeArray._from_sequence(
-                ["2000", "2001"], dtype=pd.DatetimeTZDtype(tz="CET")
+                [pd.Timestamp("2000"), pd.Timestamp("2001")],
+                dtype=pd.DatetimeTZDtype(tz="CET"),
             ),
         ),
         # Timedelta
         (
             ["1H", "2H"],
             np.dtype("timedelta64[ns]"),
-            TimedeltaArray._from_sequence(["1H", "2H"]),
+            TimedeltaArray._from_sequence([pd.Timedelta("1H"), pd.Timedelta("2H")]),
         ),
         (
             pd.TimedeltaIndex(["1H", "2H"]),
             np.dtype("timedelta64[ns]"),
-            TimedeltaArray._from_sequence(["1H", "2H"]),
+            TimedeltaArray._from_sequence([pd.Timedelta("1H"), pd.Timedelta("2H")]),
         ),
         (
             pd.TimedeltaIndex(["1H", "2H"]),
             None,
-            TimedeltaArray._from_sequence(["1H", "2H"]),
+            TimedeltaArray._from_sequence([pd.Timedelta("1H"), pd.Timedelta("2H")]),
         ),
         # Category
         (["a", "b"], "category", pd.Categorical(["a", "b"])),
@@ -184,11 +180,11 @@ def test_array_copy():
         # datetime
         (
             [pd.Timestamp("2000"), pd.Timestamp("2001")],
-            DatetimeArray._from_sequence(["2000", "2001"]),
+            DatetimeArray._from_sequence([pd.Timestamp("2000"), pd.Timestamp("2001")]),
         ),
         (
             [datetime.datetime(2000, 1, 1), datetime.datetime(2001, 1, 1)],
-            DatetimeArray._from_sequence(["2000", "2001"]),
+            DatetimeArray._from_sequence([pd.Timestamp("2000"), pd.Timestamp("2001")]),
         ),
         (
             np.array([1, 2], dtype="M8[ns]"),
@@ -202,7 +198,8 @@ def test_array_copy():
         (
             [pd.Timestamp("2000", tz="CET"), pd.Timestamp("2001", tz="CET")],
             DatetimeArray._from_sequence(
-                ["2000", "2001"], dtype=pd.DatetimeTZDtype(tz="CET")
+                [pd.Timestamp("2000"), pd.Timestamp("2001")],
+                dtype=pd.DatetimeTZDtype(tz="CET"),
             ),
         ),
         (
@@ -211,13 +208,14 @@ def test_array_copy():
                 datetime.datetime(2001, 1, 1, tzinfo=cet),
             ],
             DatetimeArray._from_sequence(
-                ["2000", "2001"], dtype=pd.DatetimeTZDtype(tz=cet)
+                [pd.Timestamp("2000"), pd.Timestamp("2001")],
+                dtype=pd.DatetimeTZDtype(tz=cet),
             ),
         ),
         # timedelta
         (
             [pd.Timedelta("1H"), pd.Timedelta("2H")],
-            TimedeltaArray._from_sequence(["1H", "2H"]),
+            TimedeltaArray._from_sequence([pd.Timedelta("1H"), pd.Timedelta("2H")]),
         ),
         (
             np.array([1, 2], dtype="m8[ns]"),

diff --git a/pandas/tests/arrays/test_datetimes.py b/pandas/tests/arrays/test_datetimes.py
@@ -21,6 +21,11 @@ def test_from_sequence_invalid_type(self):
         with pytest.raises(TypeError, match="Cannot create a DatetimeArray"):
             DatetimeArray._from_sequence(mi)
 
+        msg = "mixed scalars cannot be converted to datetime64"
+        with pytest.raises(TypeError, match=msg):
+            # GH#37179
+            DatetimeArray._from_sequence(mi._values)
+
     def test_only_1dim_accepted(self):
         arr = np.array([0, 1, 2, 3], dtype="M8[h]").astype("M8[ns]")
 
@@ -72,10 +77,10 @@ def test_mixing_naive_tzaware_raises(self, meth):
     def test_from_pandas_array(self):
         arr = pd.array(np.arange(5, dtype=np.int64)) * 3600 * 10 ** 9
 
-        result = DatetimeArray._from_sequence(arr)._with_freq("infer")
+        result = pd.DatetimeIndex(arr, freq="infer")
 
-        expected = pd.date_range("1970-01-01", periods=5, freq="H")._data
-        tm.assert_datetime_array_equal(result, expected)
+        expected = pd.date_range("1970-01-01", periods=5, freq="H")
+        tm.assert_index_equal(result, expected)
 
     def test_mismatched_timezone_raises(self):
         arr = DatetimeArray(
@@ -164,7 +169,7 @@ def test_cmp_dt64_arraylike_tznaive(self, all_compare_operators):
 class TestDatetimeArray:
     def test_astype_to_same(self):
         arr = DatetimeArray._from_sequence(
-            ["2000"], dtype=DatetimeTZDtype(tz="US/Central")
+            [pd.Timestamp("2000")], dtype=DatetimeTZDtype(tz="US/Central")
         )
         result = arr.astype(DatetimeTZDtype(tz="US/Central"), copy=False)
         assert result is arr
@@ -197,7 +202,7 @@ def test_astype_int(self, dtype):
 
     def test_tz_setter_raises(self):
         arr = DatetimeArray._from_sequence(
-            ["2000"], dtype=DatetimeTZDtype(tz="US/Central")
+            [pd.Timestamp("2000")], dtype=DatetimeTZDtype(tz="US/Central")
         )
         with pytest.raises(AttributeError, match="tz_localize"):
             arr.tz = "UTC"
@@ -441,14 +446,14 @@ def test_shift_value_tzawareness_mismatch(self):
 class TestSequenceToDT64NS:
     def test_tz_dtype_mismatch_raises(self):
         arr = DatetimeArray._from_sequence(
-            ["2000"], dtype=DatetimeTZDtype(tz="US/Central")
+            [pd.Timestamp("2000")], dtype=DatetimeTZDtype(tz="US/Central")
         )
         with pytest.raises(TypeError, match="data is already tz-aware"):
             sequence_to_dt64ns(arr, dtype=DatetimeTZDtype(tz="UTC"))
 
     def test_tz_dtype_matches(self):
         arr = DatetimeArray._from_sequence(
-            ["2000"], dtype=DatetimeTZDtype(tz="US/Central")
+            [pd.Timestamp("2000")], dtype=DatetimeTZDtype(tz="US/Central")
         )
         result, _, _ = sequence_to_dt64ns(arr, dtype=DatetimeTZDtype(tz="US/Central"))
         tm.assert_numpy_array_equal(arr._data, result)
@@ -461,12 +466,12 @@ def arr1d(self, tz_naive_fixture):
         dtype = DatetimeTZDtype(tz=tz) if tz is not None else np.dtype("M8[ns]")
         arr = DatetimeArray._from_sequence(
             [
-                "2000-01-03",
-                "2000-01-03",
-                "NaT",
-                "2000-01-02",
-                "2000-01-05",
-                "2000-01-04",
+                pd.Timestamp("2000-01-03"),
+                pd.Timestamp("2000-01-03"),
+                pd.NaT,
+                pd.Timestamp("2000-01-02"),
+                pd.Timestamp("2000-01-05"),
+                pd.Timestamp("2000-01-04"),
             ],
             dtype=dtype,
         )

diff --git a/pandas/tests/arrays/test_timedeltas.py b/pandas/tests/arrays/test_timedeltas.py
@@ -61,6 +61,16 @@ def test_copy(self):
         assert arr._data is not data
         assert arr._data.base is not data
 
+    def test_from_sequence_invalid_dtypes(self):
+        # GH#37179
+        data = np.arange(5, dtype=np.float64)
+        with pytest.raises(TypeError, match="float64"):
+            TimedeltaArray._from_sequence(data)
+
+        with pytest.raises(TypeError, match="floating"):
+            # object-dtype array of floats
+            TimedeltaArray._from_sequence(data.astype(object))
+
 
 class TestTimedeltaArray:
     # TODO: de-duplicate with test_npsum below
@@ -203,7 +213,9 @@ def test_sum_empty(self, skipna):
         assert result == Timedelta(0)
 
     def test_min_max(self):
-        arr = TimedeltaArray._from_sequence(["3H", "3H", "NaT", "2H", "5H", "4H"])
+        vals = ["3H", "3H", "NaT", "2H", "5H", "4H"]
+        vals = [Timedelta(x) for x in vals]
+        arr = TimedeltaArray._from_sequence(vals)
 
         result = arr.min()
         expected = Timedelta("2H")

diff --git a/pandas/tests/extension/test_categorical.py b/pandas/tests/extension/test_categorical.py
@@ -199,7 +199,7 @@ def test_cast_category_to_extension_dtype(self, expected):
     )
     def test_consistent_casting(self, dtype, expected):
         # GH 28448
-        result = Categorical("2015-01-01").astype(dtype)
+        result = Categorical(Timestamp("2015-01-01")).astype(dtype)
         assert result == expected
 
 

diff --git a/pandas/tests/frame/test_constructors.py b/pandas/tests/frame/test_constructors.py
@@ -2869,6 +2869,7 @@ def test_from_tzaware_mixed_object_array(self):
         ]
         assert (res.dtypes == expected_dtypes).all()
 
+    @pytest.mark.xfail(reason="DatetimeArray._from_sequence no longer accepts i8")
     def test_from_2d_ndarray_with_dtype(self):
         # GH#12513
         array_dim2 = np.arange(10).reshape((5, 2))