Python從資料存取到文字探勘 解答
以下為「Python從資料存取到文字探勘」e等公務園+測驗解答,共 14 題,供公務人員學習參考。
某個詞在文章中出現的次數可稱之為?
- IDF
- TF
- TFIDF
- TF-IDF
以二進位方式連結開啟僅供閱讀的文件,請問存取模式為?
- wb
- wa
- rb
- ba
Dictionary內的key若重複,會以哪一個Key為主?
- 最後一個
- 最前一個
- 倒數第二個
- 前面第二個
jieba具有哪些分詞模式?
- 精確模式
- 全模式
- 搜索引擎模式
- 以上皆是
jieba如何以語法加入自己定義的詞彙字串?
- add_words( )
- add_word( )
- add_char( )
- add_string( )
從 Python 字串中取出資料轉入 JSON 檔案中要使用哪一個方法?
- json.dumps( )
- json.dump( )
- json.load( )
- json.loads( )
執行urlopen後以 hasattr 函數判斷 URLError ,捕捉到 reason 屬性代表
- HTTPError
- HTMLError
- URLError
- WebError
TF-IDF是指
- TF除以IDF
- TF乘以IDF
- TF減IDF
- TF加IDF
jieba如何以語法加入自己定義的詞彙檔案?
- load_userdicts( )
- load2_userdict( )
- load_userdict( )
- loaduserdict( )
NLTK內標記單詞的方法為
- word_tokenize( )
- words_tokenize( )
- word_token( )
- words_token( )
如果一個詞愈常見到,IDF就愈接近
- 10
- 0
- -1
csv針對特定儲存格寫入的方法為?
- writerow( )
- writes( )
- writerows( )
- writesrows( )
Selenium執行完成後若要關閉所有的瀏覽器分頁該使用哪一種方法?
- exit( )
- close( )
- quit( )
- end( )
a,b=10,5.5 請問b的內容為?
- 10
- 5.5
- 4.5