Python: MapReduce Word Count

text = '''...'''
 
list = text.replace('\n',' ').split(' ')
clist = map(lambda word: (word.lower(), 1), list)
result = {}
for word in clist:
    if(word[0] in result):
        result[word[0]] += 1
    else:
        result[word[0]] = 1
clist = [(k,v) for k,v in result.iteritems()]
clist.sort(key=lambda x: -x[1]) # sorts list by counts (DESC)
clist = filter(lambda x: x[1]>1, clist)
print clist

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.