12/13 タルトがたべたい

今日は研究というより研究の道具開発をがんばった.おなかすいたな…

 

Texをwordに変換したい

シンポジウムに出す論文を,締め切り一か月前から書き始めたので余裕だと思っていた.

 

ら,

 

つい先日届いた提出形式指定が…wordだった…!!!Texで書いちゃったよ…!!!

 

ということでTexをwordに変換する手立てを探すことに.いろいろ調べてgoogle driveの変換が安心かなと思ってやってみたんだけれど,文字化けする.UTF-8で書いているから大丈夫なはずなんだけどな…?

もうしょうがないので,単純にTexでつくったPDFをエクスプローラで右クリックして,プログラムから開く>wordで開いてみた.複雑な数式は画像埋め込みになっちゃうんだけど,そのほかはそんなに問題なさそう(具体的に言うと分数になっている複雑な式がだめそう).

年末年始にこれで頑張ろうと思う…

 

Pycharmでパッケージが未インストールの場合

毎回よくわかんなくなるし,検索ワードもよくわかんないし…となるのでまとめておく.

Pycharmだとfrom ___  import ... みたいなことを書いて,...というモジュールをインストールする前に,___というパッケージがそもそも入っていないよ,という意味で赤波線を引いてくれるのでわかりやすい.

 

1 まず間違いじゃないか確認する

File > Settings > project: Dataget > Project Interpreter

からPackageを確認.ここにあったらたぶん綴り間違いとかだからコード自体を確認したほうがいい.

ここになかったら,右上のLatestっていうセルの右横にある+を押してみる.

 

2 Available Packagesの確認

開いたウィンドウで検索してみる.ここにあったら話は早くて,選択して左下のInstall Packageすればいいだけ.

kazsoga.com

上のURLの方は写真を貼ってるのでもしわからなかったら見たらいいかも.

このAvailable Packageにもなかったら,コマンドプロンプトからインストールする必要がある.

 

3 コマンドプロンプトからのインストール

わたしは毎回これが「どうやるんだっけ…」ってなるところ.笑

(※わたしはwindowsでPycharmを使っていて,pipが入っていることと,PythonをダウンロードしたときにPATHを通していること前提でうごいてます.)

windows10なので,cortanaの検索フォームみたいな,画面左下の「ここに入力して検索」というところに「コマンドプロンプト」と入力して,出てきたものをクリックしてコマンドプロンプトを立ち上げる.PATHを通していればここからいじれる.

コマンドいろいろは下のブログがわかりやすかった.

tonari-it.com

pip install パッケージ名

を入れて,エンターキーを押すだけ.こうしたら1の手順のようにPycharmから確認してもきちんと入っていてそのパッケージが使えるはず.おしまい!

 

HPにアクセスしてデータ入力してその結果を返してほしい

これ,研究には直接関係ないのかもしれないけど,交通都市研究していると「この住所の緯度経度ほしい…でも入力するのが面倒…」みたいなことは多々あるので,これをうまく自動化できたらいいなという考えで始めた.これ,めちゃめちゃつまずく.笑

Pythonはそういうのができそうというのはすでに知ってたので検索をかける.検索ワードがまずよくわからなかったのだけど,「webスクレイピング」というらしい.

Python による Web スクレイピング - RAMBO

orangain.hatenablog.com

 

・PhantomJSダウンロードして(使用ファイアウォール的に)平気なんだろうか

自分の家のじゃないのでよくわからず.とりあえず,重いけどChrome(安全な気がした)で実行.このときはドライバが必要.

sites.google.com

64bitはないけど32bitで大丈夫(64bitは超簡単に言うとPCがパワーを出せるバージョンみたいなもの).つぎにダウンロードしたchromedriver.exeをseleniumフォルダの直下におく.こちらを参考にさせていただいた.

qiita.com

コードで使うときには,パスを指定しないとエラーになるので注意.

webdriver.Chrome(executable_path=C:\\Users\\bin\\Anaconda3\\Lib\\site-packages\\selenium\\chromedriver)

とか(\だとエラーになるので二回重ねるのを忘れずに).

clientver2.hatenablog.com

あとはぽんぽん入れて試してをくりかえすだけ.くれぐれも相手サーバに負荷をかけないよう,

import time
time.sleep(10)

をはさんで,10秒ごととかにアクセスするようにすること!

 

時間があるときに見たい

qiita.com

www.superdbtool.com

PS

昨日引用させていただいたブログの筆者の方がこの勉強日記を見てくださったみたい.わたし,hatenaのシステムをあまり理解してなくて,スターとやらのお返しの仕方がわからないのですが笑,今後も参考にさせていただきます.ありがとうございます.