Python從資料存取到文字探勘 解答

資訊科技 14 題 · 更新 2024-06-04

以下為「Python從資料存取到文字探勘」e等公務園+測驗解答,共 14 題,供公務人員學習參考。

某個詞在文章中出現的次數可稱之為?

  • IDF
  • TF
  • TFIDF
  • TF-IDF

以二進位方式連結開啟僅供閱讀的文件,請問存取模式為?

  • wb
  • wa
  • rb
  • ba

Dictionary內的key若重複,會以哪一個Key為主?

  • 最後一個
  • 最前一個
  • 倒數第二個
  • 前面第二個

jieba具有哪些分詞模式?

  • 精確模式
  • 全模式
  • 搜索引擎模式
  • 以上皆是

jieba如何以語法加入自己定義的詞彙字串?

  • add_words( )
  • add_word( )
  • add_char( )
  • add_string( )

從 Python 字串中取出資料轉入 JSON 檔案中要使用哪一個方法?

  • json.dumps( )
  • json.dump( )
  • json.load( )
  • json.loads( )

執行urlopen後以 hasattr 函數判斷 URLError ,捕捉到 reason 屬性代表

  • HTTPError
  • HTMLError
  • URLError
  • WebError

TF-IDF是指

  • TF除以IDF
  • TF乘以IDF
  • TF減IDF
  • TF加IDF

jieba如何以語法加入自己定義的詞彙檔案?

  • load_userdicts( )
  • load2_userdict( )
  • load_userdict( )
  • loaduserdict( )

NLTK內標記單詞的方法為

  • word_tokenize( )
  • words_tokenize( )
  • word_token( )
  • words_token( )

如果一個詞愈常見到,IDF就愈接近

  • 10
  • 0
  • -1

csv針對特定儲存格寫入的方法為?

  • writerow( )
  • writes( )
  • writerows( )
  • writesrows( )

Selenium執行完成後若要關閉所有的瀏覽器分頁該使用哪一種方法?

  • exit( )
  • close( )
  • quit( )
  • end( )

a,b=10,5.5 請問b的內容為?

  • 10
  • 5.5
  • 4.5