Spark大数据商业实战三部曲:内核解密、商业案例、性能调优(第2版)
上QQ阅读APP看书,第一时间看更新

2.6 Spark 2.4 GraphX

在Apache Spark 2.2.X版本的基础上,Apache Spark 2.3.X版本、Apache Spark 2.4.X版本中GraphX的更新如下。

 SPARK-5484:Pregel现在定期检查以避免堆栈溢出错误。

 SPARK-21491:几个地方的性能改善很小。

 SPARK-26757:GraphX EdgeRDDImpl及VertexRDDImpl的count方法不能处理空的RDDs。

 SPARK-25268:运行Parallel Personalized PageRank抛出序列化异常。