Attachment '2013-12-20-anna2.py'

Download

   1 #!/usr/bin/env python
   2 # coding: utf
   3 '''
   4 Найти самое часто употребляемое слово в романе Льва Толстого «Анна Каренина».
   5 - слово — последовательность русских букв без учёта регистра
   6 - сделать это для слов любой длины, начинающихся с маленькой буквы
   7 '''
   8 
   9 MAXLEN=10
  10 
  11 # Словари для слов каждой длины
  12 Dict={}
  13 # Алфавит
  14 abc="".join([unichr(c) for c in range(ord(u"а"),ord(u"я")+1)+range(ord(u"А"),ord(u"Я")+1)])
  15 anna_kar = open("anna.txt").read().decode("utf-8")
  16 
  17 w=""
  18 for c in anna_kar:
  19     if c in abc:
  20         w+=c
  21     elif w:
  22         if w[0].islower():
  23             Dict[len(w)][w]=Dict.setdefault(len(w),{}).setdefault(w,0)+1
  24         w=""
  25 
  26 for i in sorted(Dict.keys()):
  27     n,w = max(zip(Dict[i].values(),Dict[i].keys()))
  28     print u"{0}: {1} ({2})".format(i, w, n)

Attached Files

To refer to attachments on a page, use attachment:filename, as shown below in the list of files. Do NOT use the URL of the [get] link, since this is subject to change and can break easily.

You are not allowed to attach a file to this page.