[BUG] test_broadcast_nested_loop_join_special_case fails on databricks #441

tgravescs · 2020-07-27T18:08:17Z

Running integration tests on Databricks, I'm seeing test_broadcast_nested_loop_join_special_case fail:

FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[String][IGNORE_ORDER({'local': True})]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Byte][IGNORE_ORDER({'local': True})]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Short][IGNORE_ORDER({'local': True})]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Integer][IGNORE_ORDER({'local': True})]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Long][IGNORE_ORDER({'local': True})]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Boolean][IGNORE_ORDER({'local': True})]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Date][IGNORE_ORDER({'local': True})]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Timestamp][IGNORE_ORDER({'local': True})]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Float][IGNORE_ORDER({'local': True}), INCOMPAT]
FAILED src/main/python/join_test.py::test_broadcast_nested_loop_join_special_case[Double][IGNORE_ORDER({'local': True}), INCOMPAT]

revans2 · 2020-07-29T18:59:11Z

The error is

20/07/29 18:58:27 WARN TaskSetManager: Lost task 0.0 in stage 58.0 (TID 49, ip-10-59-230-224.us-west-2.compute.internal, executor driver): java.lang.ArrayIndexOutOfBoundsException: 0
	at ai.rapids.cudf.Table.<init>(Table.java:52)
	at com.nvidia.spark.rapids.GpuColumnVector.from(GpuColumnVector.java:245)
	at org.apache.spark.sql.rapids.execution.GpuBroadcastNestedLoopJoinExecBase.$anonfun$doExecuteColumnar$5(GpuBroadcastNestedLoopJoinExec.scala:235)
	at com.nvidia.spark.rapids.Arm.withResource(Arm.scala:26)
	at com.nvidia.spark.rapids.Arm.withResource$(Arm.scala:24)
	at org.apache.spark.sql.rapids.execution.GpuBroadcastNestedLoopJoinExecBase.withResource(GpuBroadcastNestedLoopJoinExec.scala:134)
	at org.apache.spark.sql.rapids.execution.GpuBroadcastNestedLoopJoinExecBase.builtTable$lzycompute$1(GpuBroadcastNestedLoopJoinExec.scala:234)
	at org.apache.spark.sql.rapids.execution.GpuBroadcastNestedLoopJoinExecBase.builtTable$2(GpuBroadcastNestedLoopJoinExec.scala:233)
	at org.apache.spark.sql.rapids.execution.GpuBroadcastNestedLoopJoinExecBase.$anonfun$doExecuteColumnar$7(GpuBroadcastNestedLoopJoinExec.scala:249)
	at org.apache.spark.rdd.RDD.$anonfun$mapPartitions$2(RDD.scala:844)
	at org.apache.spark.rdd.RDD.$anonfun$mapPartitions$2$adapted(RDD.scala:844)
	at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:60)
	at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:356)
	at org.apache.spark.rdd.RDD.iterator(RDD.scala:320)
	at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:60)
	at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:356)
	at org.apache.spark.rdd.RDD.iterator(RDD.scala:320)
	at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:60)
	at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:356)
	at org.apache.spark.rdd.RDD.iterator(RDD.scala:320)
	at org.apache.spark.shuffle.ShuffleWriteProcessor.write(ShuffleWriteProcessor.scala:59)
	at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:99)
	at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:52)
	at org.apache.spark.scheduler.Task.doRunTask(Task.scala:144)
	at org.apache.spark.scheduler.Task.run(Task.scala:117)
	at org.apache.spark.executor.Executor$TaskRunner.$anonfun$run$9(Executor.scala:639)
	at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1559)
	at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:642)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
	at java.lang.Thread.run(Thread.java:748)

revans2 · 2020-07-29T20:22:30Z

Looks like they are doing a join where one of the sides has no columns, just rows. In this case I think we need to duplicate the table that does have rows N times where N is the number of rows in the join table with no columns.

revans2 · 2020-07-29T20:32:42Z

I think to do this properly we want to put in the cudf repeat API.

Signed-off-by: spark-rapids automation <70000568+nvauto@users.noreply.github.com>

tgravescs added bug Something isn't working ? - Needs Triage Need team to review and classify labels Jul 27, 2020

sameerz added P0 Must have for release and removed ? - Needs Triage Need team to review and classify labels Jul 28, 2020

sameerz assigned revans2 Jul 28, 2020

This was referenced Jul 30, 2020

[BUG] test_broadcast_nested_loop_join_special_case fails on databricks #427

Closed

Fix special case joins in broadcast nested loop join #477

Merged

revans2 closed this as completed in #477 Jul 30, 2020

pxLi pushed a commit to pxLi/spark-rapids that referenced this issue May 12, 2022

Clean up fuel/hci/server/login.py (NVIDIA#441)

0e9d245

tgravescs pushed a commit to tgravescs/spark-rapids that referenced this issue Nov 30, 2023

Update submodule cudf to 6e0e47e (NVIDIA#441)

0d7dd58

Signed-off-by: spark-rapids automation <70000568+nvauto@users.noreply.github.com>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[BUG] test_broadcast_nested_loop_join_special_case fails on databricks #441

[BUG] test_broadcast_nested_loop_join_special_case fails on databricks #441

tgravescs commented Jul 27, 2020

revans2 commented Jul 29, 2020

revans2 commented Jul 29, 2020

revans2 commented Jul 29, 2020

[BUG] test_broadcast_nested_loop_join_special_case fails on databricks #441

[BUG] test_broadcast_nested_loop_join_special_case fails on databricks #441

Comments

tgravescs commented Jul 27, 2020

revans2 commented Jul 29, 2020

revans2 commented Jul 29, 2020

revans2 commented Jul 29, 2020