NVIDIA · revans2 · Oct 18, 2023 · Oct 9, 2023 · Oct 9, 2023 · Oct 10, 2023
diff --git a/integration_tests/src/main/python/data_gen.py b/integration_tests/src/main/python/data_gen.py
@@ -21,7 +21,7 @@
 from pyspark.sql.types import *
 import pyspark.sql.functions as f
 import random
-from spark_session import is_tz_utc, is_before_spark_340
+from spark_session import is_tz_utc, is_before_spark_340, with_cpu_session
 import sre_yield
 import struct
 from conftest import skip_unless_precommit_tests
@@ -596,11 +596,12 @@ def __init__(self, start=None, end=None, nullable=True, tzinfo=timezone.utc):
         self._epoch = datetime(1970, 1, 1, tzinfo=tzinfo)
         self._start_time = self._to_us_since_epoch(start)
         self._end_time = self._to_us_since_epoch(end)
+        self._tzinfo = tzinfo
         if (self._epoch >= start and self._epoch <= end):
             self.with_special_case(self._epoch)
 
     def _cache_repr(self):
-        return super()._cache_repr() + '(' + str(self._start_time) + ',' + str(self._end_time) + ')'
+        return super()._cache_repr() + '(' + str(self._start_time) + ',' + str(self._end_time) + ',' + str(self._tzinfo) + ')'
 
     _us = timedelta(microseconds=1)
 
@@ -831,11 +832,15 @@ def _gen_scalars_common(data_gen, count, seed=0):
 
 def gen_scalars(data_gen, count, seed=0, force_no_nulls=False):
     """Generate scalar values."""
-    if force_no_nulls:
-        assert(not isinstance(data_gen, NullGen))
-    src = _gen_scalars_common(data_gen, count, seed=seed)
-    data_type = src.data_type
-    return (_mark_as_lit(src.gen(force_no_nulls=force_no_nulls), data_type) for i in range(0, count))
+    def gen_scalars_help(data_gen, count, seed, force_no_nulls):
+        if force_no_nulls:
+            assert(not isinstance(data_gen, NullGen))
+        src = _gen_scalars_common(data_gen, count, seed=seed)
+        data_type = src.data_type
+        return (_mark_as_lit(src.gen(force_no_nulls=force_no_nulls), data_type) for i in range(0, count))
+    return with_cpu_session(lambda spark: gen_scalars_help(data_gen=data_gen, 
+                                                           count=count, seed=seed, 
+                                                           force_no_nulls=force_no_nulls))
 
 def gen_scalar(data_gen, seed=0, force_no_nulls=False):
     """Generate a single scalar value."""
@@ -1172,4 +1177,3 @@ def get_25_partitions_df(spark):
         StructField("c3", IntegerType())])
     data = [[i, j, k] for i in range(0, 5) for j in range(0, 5) for k in range(0, 100)]
     return spark.createDataFrame(data, schema)
-