「エディタでの表示の問題」なのか「タイプセットで作成された PDF 」なのかわからないのですが、 文字コード変換された方法(ツール名やオプション)と 使用されているエディタを教えてください。 また、添付の sjis のソースを utf-8 のに変換した場合はどうなりますか
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米ミシガン大学の研究チームが開発した「texSketch」は、電子書籍の読書中に重要な箇所をマーカーで選び、それらを線でつなげてグラフィカルに整理できるダイヤグラムシステムだ。 (a)黄色いマーカーを引くと、その文章内で重要な因果関係のある用語に破線のアンダーラインが追加される(b)赤のアンダーラインを引くとダイヤグラム要素として抽出される(c)抽出した用語をつなげていく 本を読みながらその内容をダイヤグラムに落とし込んでいくことは、内容を効率的に理解する助けとなる。視覚的に俯瞰し、関係性や考えを整理できるからだ。 texSketchは、読書中のダイヤグラム作成をサポートする。重要な箇所に
#大学生の日常も大事だ というハッシュタグがツィッターを席巻したことがありました。そこで、しばらくこのハッシュタグのついたツィートや、そのツィートをしたアカウントのツィートをツィッタAPIで収集しておりました。 7/10から7/29までに取得した173GBのツィートのデータから、当該ハッシュタグのついた88,082件ツィートを、Pythonであれこれ整形して、さらにKHコーダを使ってちょこちょこいじってみて、なるほど、こういう感じかな、と思ったのが以下の図です。 コーディング:MDS 「今後」と「辛さ」、「施設」と「費用」がそれぞれ近いということ、それから、「横の人間関係」が「勉強・研究」と比較的近いことが興味深いところです。 なお、今回の分析の仕方だと、否定表現も肯定表現も区別できていません。「辛くない」というツィートがあったとしたら「辛い」として カウントされてますので、上の図はそうい
あけおめ(死語)。昨年は本当にろくでもない仕事が振ってきて、あまりのストレスで体重は一時5キロも減り (残念ながらその後リバウンド)、しかもそれが期間延長というトホホなことになって、秋に終わるはずが年内いっぱいかかり、ギリギリのところで何とか終えて、年末年始はほぼ脱力状態。おかげで去年はMake系のおもちゃもいじれなかったけれど、正月休みにそれをやるだけの気力もなくて、いやはやもう歳ですなー、なんか威勢のいいことをやるのも疲れたぜ〜〜 と思っていたところで読んだこんな話。 econ101.jp ほうほう、経済学の新しい枠組みね。 さて、ぼくは「従来の経済学ダメー」「新しい経済学だぜー」といった話にはあまりいい印象を持っていない。基本、学問ってある程度は単純化による理解なので、すべて入ってないというだけで批判したことにはならないと思う。ここに挙がっている表を見ても、わかってて単純化した部分に
KH Coderとは、テキスト型データの計量的な内容分析(計量テキスト分析)もしくはテキストマイニングのためのフリーソフトウェアである。各種の検索を行えるほか、どんな言葉が多く出現していたのかを頻度表から見ることができる。さらに多変量解析によって、一緒に出現することが多い言葉のグループや、同じ言葉を含む文書のグループを見ることで、データ中に含まれるコンセプトを探索できる。また一部の文書群に注目した場合に、その文書群に特に多く出現する言葉をリストアップすることで、その文書群の特徴を探索できる。あるいは分析者が指定した基準によって、文書の分類を自動的に行うこともできる。 多変量解析の具体的な手法としては、対応分析(数量化III類)・クラスター分析・多次元尺度構成法(MDS)・自己組織化マップ・共起ネットワーク・機械学習(ナイーブベイズ)などに対応している。 こうした分析を日本語・英語データに対
2017年2月8日、米・マサチューセッツ大学アマースト校図書館は、同館の学術コミュニケーションオフィスによるオープンな教科書に関するイニシアチブ(OEI)が学部学生を対象に行った調査の結果を発表しています。 同館が、イニシアチブに参加するクラスの教員に対して資金を提供し、値段の高い教科書の代わりに、教員がオープンな教育リソース(OER)を用いて教材を作成するもので、それら教材等についての意見を、450人の学生(哲学、運動学、天文学、フランス語、ドイツ語、人間発達学)から聴取したものです。 調査結果として以下のことが指摘されています。 ・88%の学生が、他のコースの教科書と比べて、その内容が同等かそれ以上であると回答 ・半数を超える学生が、それら教材を用いることで、クラスへの参加・関与・達成の度合が増したと回答 ・78%の学生が低価格、無料の教材を用いた他のコースにも登録すると回答 ・59%
橋口・和本論の完結編は「書入と注釈」を取り上げる。コメントとアノテーションは、知識コミュニケーションの装置としての本の機能の最も重要な側面だ。そして和本は非常にユニークな方法でソーシャルな空間を共時的、通時的に実現してきた。絵巻と黄表紙がマンガやアニメの祖型としたら、漢籍を拡張した「書入と注釈」はハイパーテキストの祖型であると思われる。だからこの祖型は、デジタルに、創造的に蘇らせることができるだろう。(編集子解題) 1. 装置としての書物:読み解かれることで再生産される知 和本に対すると、テクストを受け入れるという意味での「読む」ことは、書物の持っている目的の一部分にすぎないことがよくわかる。作品をテクストという視点からだけで見てしまうと、書物の果たした役割が見えなくなってしまう。このことは書物がたんなる原典の複製的役割を持つだけでなく、さまざまな加工を施すことで、さらに進んだ別の世界に人
国は日本を代表する文学作品(本当は全集まで)を責任をもって電子化して世界に公開せよ 青空文庫など個人が入力した電子化テクストについて TLやFacebookで 青空文庫のテクストが「不正確」だ という指摘と、それに対しての反論とが飛び交っている。 で。 普段写本や版本等から翻字している立場から言うと 他人の翻字は信用するな でおしまい。 更に言えば 他人が電子化してくれたテクストは感謝しつつ使用すべき であって、 正確を期すために、信用すべき底本と参照するのは自分の仕事 である。 わたしは87年に初めてパソコン(98互換機のEPSON 286-V STD)を使い始めた時から OCRによる電子化テクスト をその使用目的としていた。残念ながら87年当時は、いまのように個人が気軽に 自炊 できるようなスペックの機器はなく、まだOCR入力は自前の装置ではできなかったが、HAL研のハンディスキャナで
あまり細かいことは気にせずテキスト分類器のRubyライブラリを1コマンドで自動生成する便利ツールを作りました。 いろいろ迷走している間に。 gem install nekoneko_genでインストールできます。 なにをするものなのか、ちょっと分かりにくいので、例で説明します。 2ちゃんねるの投稿からどのスレッドの投稿か判定するライブラリを生成する 例として、2ちゃんねるに投稿されたデータから、投稿(レス)がどのスレッドのレスか判定するライブラリを生成してみます。 準備 まず gem install nekoneko_genでインストールします。 Ruby 1.8.7でも1.9.2でも動きますが1.9.2のほうが5倍くらい速いので1.9.2以降がおすすめです。 環境は、ここではUbuntuを想定しますが、Windowsでも使えます。(WindowsXP, ruby 1.9.3p0で確認)
テキストボックスに比較したい文章をコピペしてボタンを押すだけで2つの文章でどこが変更されたのか、差分の確認ができるネットサービスが「difff(デュフフ)」です。名前はちょっとネタっぽいですが、実用性は高く、日本語のテキストでもOKです。 difff - デュフフ http://altair.dbcls.jp/difff/ サイトの見た目はこんな感じ、テキストボックスが2つ上下に並んでいるので、変更前の文章と変更後の文章をそれぞれ貼り付け、最後に「比較する」ボタンを押すだけ。 結果はこんな感じで変更前が左、変更後が右に表示されます。段落が左右で揃っていて、変更部分はハイライト表示されるので、どこが異なっているのかが一目で確認できます。 ぱっと目で見ただけではどこが変わっているのかわからないようなものでも…… このツールであれば確認できます。このケースだと、カッコが半角から全角に変わっていま
tbaggery - A Note About Git Commit Messages A successful Git branching model » nvie.com Commit Often, Perfect Later, Publish Once—Git Best Practices だいたいこれらに書いてあることを考えている。 基本的にGit Successful Branch Modelで運用する。git-flowを入れて使っているけど、手でやってもそんなに面倒ではないし好きなようにしたらよさそう。 Subversionを個人で使っていたころはブランチはよくわからないけど恐しいものだったけど、Gitを使いはじめてだいぶ親しめるようになった。 文字通り、ブランチ、枝である。気軽に扱えるということは理解の助けにもなる。 コミットの単位 論理的に最小限度のコミットをつくる。「こう
2年前のEmacs の M-x grep をマルチエンコーディングにで文字コードの混ざった環境でも日本語で検索できるようになって便利って話をしたんだけど、実はこれ、手元の環境では emacs -nw でしかちゃんと動いてなかった。 普段 Emacs を Emacs らしく使う際のほとんどの時間は -nw で使っているんだけど、ViewSourceWith や It's All Text を使って Firefox や Thunderbird から、あるいは日本語の文字幅の問題から直接 CarbonEmacs を window で使うこともある。数ヶ月前に初めて気づいたんだけど、以前の設定で lgrep を呼び出すと日本語検索で余計なものが引っかかったり、必要なものが引っかからなかったりしてまったく使いものになっていなかった。 twitter で何度もつぶやいてたりあれこれ検索していたんだけど
Annotatorはテキスト本文中に注釈を付けられるソフトウェア。 AnnotatorはJavaScript/Python製のオープンソース・ソフトウェア。ブログをはじめとするテキストサイトにおいて、“ここ”にコメントしたいと思うことは多々ある。だが大抵文章の一番最後にしかコメントフォームがなかったりする。これではどこにコメントされたのかも分かりづらい。 説明を表示している所 やり方は幾つかあると思うが、自分の好きな場所にコメントできるとコメントされた側も分かりやすいのではないだろうか。そのようなシステムは論文においても有効だ。それを実現するソフトウェアがAnnotatorだ。 AnnotatorはJavaScriptでフロントエンドを、バックエンドをPythonで実装した注釈管理システムだ。一つの文章内において分かりづらいと思える部分があればそこを選択して説明を加えることができる。説明は
Peter Lamarque, "The Death of the Author: An Analytical Autopsy," British Journal Of Aesthetics, 40:4(1990), pp. 319-31. Aesthetics and the Philosophy of Art: The Analytic Tradition: An Anthology, ed. Peter Lamarque, Stein Haugom Olsen(Blackwell, 2003), pp. 433-41. Aesthetics and the Philosophy of Art: The Analytic Tradition: An Anthology (Blackwell Philosophy Anthologies) ラマルク「作者の死 - 分析的検死」という論文を
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く