Spark AttributeError：“ SparkContext”对象没有属性“ map”

Question

我在Hortonworks Data Platform 2.2上使用Spark，出现以下错误...有什么想法吗？

#!/usr/bin/env python

import sys
import pyspark
from pyspark import SparkContext

if 'sc' not in globals():
    #sc = SparkContext('local[4]', 'pyspark','map')
    sc = SparkContext(appName="PythonKMeans")

nums = sc.map([23,232,1,232,43,43])
squared = nums.map(lambda x: x*x).collect()
for num in squared:
    print num

Answer 1

代替

nums = sc.map([23,232,1,232,43,43])

尝试

nums = sc.parallelize([23,232,1,232,43,43])

这告诉Spark在整个集群上分配序列，并从中创建一个RDD。 然后，可以像在下一行中那样在RDD上使用lambda函数调用map。

Spark AttributeError：“ SparkContext”对象没有属性“ map”

问题描述

1 个解决方案

解决方案1
1 已采纳 2015-03-19 21:53:12

Spark AttributeError：“ SparkContext”对象没有属性“ map”

问题描述

1 个解决方案

解决方案1 1 已采纳 2015-03-19 21:53:12

解决方案1
1 已采纳 2015-03-19 21:53:12