Object

org.apache.spark.sql.api.r.SQLUtils

public class SQLUtils extends Object

Constructor Summary

Constructors

Constructor

Description

SQLUtils()
Method Summary

Modifier and Type

Method

Description

static ArrayType

createArrayType(String elementType)

static org.apache.spark.sql.classic.Dataset<Row>

createDF(RDD<byte[]> rdd, StructType schema, org.apache.spark.sql.classic.SparkSession sparkSession)

static StructField

createStructField(String name, String dataType, boolean nullable)

static StructType

createStructType(scala.collection.immutable.Seq<StructField> fields)

static org.apache.spark.sql.classic.Dataset<Row>

dapply(org.apache.spark.sql.classic.Dataset<Row> df, byte[] func, byte[] packageNames, Object[] broadcastVars, StructType schema)

The helper function for dapply() on R side.

static Object[][]

dfToCols(org.apache.spark.sql.classic.Dataset<Row> df)

static JavaRDD<byte[]>

dfToRowRDD(org.apache.spark.sql.classic.Dataset<Row> df)

static org.apache.spark.sql.classic.Dataset<Row>

gapply(org.apache.spark.sql.classic.RelationalGroupedDataset gd, byte[] func, byte[] packageNames, Object[] broadcastVars, StructType schema)

The helper function for gapply() on R side.

static JavaSparkContext

getJavaSparkContext(org.apache.spark.sql.classic.SparkSession spark)

static org.apache.spark.sql.classic.SparkSession

getOrCreateSparkSession(JavaSparkContext jsc, Map<Object,Object> sparkConfigMap, boolean enableHiveSupport)

static Map<String,String>

getSessionConf(org.apache.spark.sql.classic.SparkSession spark)

static String[]

getTableNames(org.apache.spark.sql.classic.SparkSession sparkSession, String databaseName)

static org.apache.spark.internal.Logging.LogStringContext

LogStringContext(scala.StringContext sc)

static org.slf4j.Logger

org$apache$spark$internal$Logging$$log_()

static void

org$apache$spark$internal$Logging$$log__$eq(org.slf4j.Logger x$1)

static JavaRDD<byte[]>

readArrowStreamFromFile(org.apache.spark.sql.classic.SparkSession sparkSession, String filename)

R callable function to read a file in Arrow stream format and create an RDD using each serialized ArrowRecordBatch as a partition.

static Object

readSqlObject(DataInputStream dis, char dataType)

static StructType

SERIALIZED_R_DATA_SCHEMA()

static void

setSparkContextSessionConf(org.apache.spark.sql.classic.SparkSession spark, Map<Object,Object> sparkConfigMap)

static org.apache.spark.sql.classic.Dataset<Row>

toDataFrame(JavaRDD<byte[]> arrowBatchRDD, StructType schema, org.apache.spark.sql.classic.SparkSession sparkSession)

R callable function to create a DataFrame from a JavaRDD of serialized ArrowRecordBatches.

static boolean

writeSqlObject(DataOutputStream dos, Object obj)

Methods inherited from class java.lang.Object
equals, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait

Constructor Details
- SQLUtils
  
  public SQLUtils()
Method Details
- getOrCreateSparkSession
  
  public static org.apache.spark.sql.classic.SparkSession getOrCreateSparkSession(JavaSparkContext jsc, Map<Object,Object> sparkConfigMap, boolean enableHiveSupport)
- setSparkContextSessionConf
  
  public static void setSparkContextSessionConf(org.apache.spark.sql.classic.SparkSession spark, Map<Object,Object> sparkConfigMap)
- getSessionConf
  
  public static Map<String,String> getSessionConf(org.apache.spark.sql.classic.SparkSession spark)
- getJavaSparkContext
  
  public static JavaSparkContext getJavaSparkContext(org.apache.spark.sql.classic.SparkSession spark)
- createStructType
  
  public static StructType createStructType(scala.collection.immutable.Seq<StructField> fields)
- createStructField
  
  public static StructField createStructField(String name, String dataType, boolean nullable)
- createDF
  
  public static org.apache.spark.sql.classic.Dataset<Row> createDF(RDD<byte[]> rdd, StructType schema, org.apache.spark.sql.classic.SparkSession sparkSession)
- dfToRowRDD
  
  public static JavaRDD<byte[]> dfToRowRDD(org.apache.spark.sql.classic.Dataset<Row> df)
- SERIALIZED_R_DATA_SCHEMA
  
  public static StructType SERIALIZED_R_DATA_SCHEMA()
- dapply
  
  public static org.apache.spark.sql.classic.Dataset<Row> dapply(org.apache.spark.sql.classic.Dataset<Row> df, byte[] func, byte[] packageNames, Object[] broadcastVars, StructType schema)
  
  The helper function for dapply() on R side.
  
  Parameters:
  
  df - (undocumented)
  
  func - (undocumented)
  
  packageNames - (undocumented)
  
  broadcastVars - (undocumented)
  
  schema - (undocumented)
  
  Returns:
  
  (undocumented)
- gapply
  
  public static org.apache.spark.sql.classic.Dataset<Row> gapply(org.apache.spark.sql.classic.RelationalGroupedDataset gd, byte[] func, byte[] packageNames, Object[] broadcastVars, StructType schema)
  
  The helper function for gapply() on R side.
  
  Parameters:
  
  gd - (undocumented)
  
  func - (undocumented)
  
  packageNames - (undocumented)
  
  broadcastVars - (undocumented)
  
  schema - (undocumented)
  
  Returns:
  
  (undocumented)
- dfToCols
  
  public static Object[][] dfToCols(org.apache.spark.sql.classic.Dataset<Row> df)
- readSqlObject
  
  public static Object readSqlObject(DataInputStream dis, char dataType)
- writeSqlObject
  
  public static boolean writeSqlObject(DataOutputStream dos, Object obj)
- getTableNames
  
  public static String[] getTableNames(org.apache.spark.sql.classic.SparkSession sparkSession, String databaseName)
- createArrayType
  
  public static ArrayType createArrayType(String elementType)
- readArrowStreamFromFile
  
  public static JavaRDD<byte[]> readArrowStreamFromFile(org.apache.spark.sql.classic.SparkSession sparkSession, String filename)
  
  R callable function to read a file in Arrow stream format and create an RDD using each serialized ArrowRecordBatch as a partition.
  
  Parameters:
  
  sparkSession - (undocumented)
  
  filename - (undocumented)
  
  Returns:
  
  (undocumented)
- toDataFrame
  
  public static org.apache.spark.sql.classic.Dataset<Row> toDataFrame(JavaRDD<byte[]> arrowBatchRDD, StructType schema, org.apache.spark.sql.classic.SparkSession sparkSession)
  
  R callable function to create a DataFrame from a JavaRDD of serialized ArrowRecordBatches.
  
  Parameters:
  
  arrowBatchRDD - (undocumented)
  
  schema - (undocumented)
  
  sparkSession - (undocumented)
  
  Returns:
  
  (undocumented)
- org$apache$spark$internal$Logging$$log_
  
  public static org.slf4j.Logger org$apache$spark$internal$Logging$$log_()
- org$apache$spark$internal$Logging$$log__$eq
  
  public static void org$apache$spark$internal$Logging$$log__$eq(org.slf4j.Logger x$1)
- LogStringContext
  
  public static org.apache.spark.internal.Logging.LogStringContext LogStringContext(scala.StringContext sc)

Class SQLUtils

Constructor Summary

Method Summary

Methods inherited from class java.lang.Object

Constructor Details

SQLUtils

Method Details

getOrCreateSparkSession

setSparkContextSessionConf

getSessionConf

getJavaSparkContext

createStructType

createStructField

createDF

dfToRowRDD

SERIALIZED_R_DATA_SCHEMA

dapply

gapply

dfToCols

readSqlObject

writeSqlObject

getTableNames

createArrayType

readArrowStreamFromFile

toDataFrame

org$apache$spark$internal$Logging$$log_

org$apache$spark$internal$Logging$$log__$eq

LogStringContext