<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Kommentare zu: Blog-Analysen</title>
	<atom:link href="http://www.mathias-bank.de/2009/12/17/blog-analysen/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.mathias-bank.de/2009/12/17/blog-analysen/</link>
	<description>what&#039;s moving me</description>
	<lastBuildDate>Sat, 28 Jan 2012 13:07:38 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
	<item>
		<title>Von: Deutscher Blog-Corpus &#124; Mein Leben aus dem Koffer</title>
		<link>http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24232</link>
		<dc:creator>Deutscher Blog-Corpus &#124; Mein Leben aus dem Koffer</dc:creator>
		<pubDate>Mon, 21 Dec 2009 12:37:38 +0000</pubDate>
		<guid isPermaLink="false">http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24232</guid>
		<description>[...] und so möchte er eine solche für die deutsche Blogszene erstellen. Für Fragen steht er offensichtlich über seinem eigenen Blog zur Verfügung. Ich bin sehr gespannt, was dabei so [...]</description>
		<content:encoded><![CDATA[<p>[...] und so möchte er eine solche für die deutsche Blogszene erstellen. Für Fragen steht er offensichtlich über seinem eigenen Blog zur Verfügung. Ich bin sehr gespannt, was dabei so [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Hannelore Vonier</title>
		<link>http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24222</link>
		<dc:creator>Hannelore Vonier</dc:creator>
		<pubDate>Fri, 18 Dec 2009 15:50:29 +0000</pubDate>
		<guid isPermaLink="false">http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24222</guid>
		<description>Gefällt mir, starkes Projekt!
Ich bin gespannt, wie du es in den Griff kriegst.

Die Art der Fragestellung ist äußerst schwierig, denn schon bei deinen 3 Beispielen fiel mir ein Schwachpunkt auf:
&quot;Verwenden Frauen mehr Adjektive?&quot; - Wer schreiben richtig gelernt hat, egal ob Mann oder Frau, streicht beim Überarbeiten so viele Adjektive wie möglich, um einen guten Stil zu erreichen.
Das - und vieles andere - gehört zum Handwerk. Ich habe es mir antrainiert. Verfälscht die Statistik, oder? ;-)

Jedenfalls habe ich mich angemeldet. Übrigens fehlt eine Option bei der Berufsangabe: nicht berufstätig. Mir blieb nur die Möglichkeit &quot;keine Angabe&quot;. Ich kenne viele Blogger, die nicht (mehr) berufstätig sind. Liegt ja bei den demografischen Verhältnissen auf der Hand.

- Hannelore</description>
		<content:encoded><![CDATA[<p>Gefällt mir, starkes Projekt!<br />
Ich bin gespannt, wie du es in den Griff kriegst.</p>
<p>Die Art der Fragestellung ist äußerst schwierig, denn schon bei deinen 3 Beispielen fiel mir ein Schwachpunkt auf:<br />
&#8220;Verwenden Frauen mehr Adjektive?&#8221; &#8211; Wer schreiben richtig gelernt hat, egal ob Mann oder Frau, streicht beim Überarbeiten so viele Adjektive wie möglich, um einen guten Stil zu erreichen.<br />
Das &#8211; und vieles andere &#8211; gehört zum Handwerk. Ich habe es mir antrainiert. Verfälscht die Statistik, oder? <img src='http://www.mathias-bank.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
<p>Jedenfalls habe ich mich angemeldet. Übrigens fehlt eine Option bei der Berufsangabe: nicht berufstätig. Mir blieb nur die Möglichkeit &#8220;keine Angabe&#8221;. Ich kenne viele Blogger, die nicht (mehr) berufstätig sind. Liegt ja bei den demografischen Verhältnissen auf der Hand.</p>
<p>- Hannelore</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Twitter Trackbacks for Mathias Bank » Blog-Analysen [mathias-bank.de] on Topsy.com</title>
		<link>http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24220</link>
		<dc:creator>Twitter Trackbacks for Mathias Bank » Blog-Analysen [mathias-bank.de] on Topsy.com</dc:creator>
		<pubDate>Fri, 18 Dec 2009 10:50:26 +0000</pubDate>
		<guid isPermaLink="false">http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24220</guid>
		<description>[...] Mathias Bank » Blog-Analysen  www.mathias-bank.de/2009/12/17/blog-analysen &#8211; view page &#8211; cached  Bei Robert kam bezüglich dem deutschen Blog-Corpus die Frage auf, was denn analysiert werden soll. [...]</description>
		<content:encoded><![CDATA[<p>[...] Mathias Bank » Blog-Analysen  <a href="http://www.mathias-bank.de/2009/12/17/blog-analysen" rel="nofollow">http://www.mathias-bank.de/2009/12/17/blog-analysen</a> &ndash; view page &ndash; cached  Bei Robert kam bezüglich dem deutschen Blog-Corpus die Frage auf, was denn analysiert werden soll. [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Mathias Bank</title>
		<link>http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24219</link>
		<dc:creator>Mathias Bank</dc:creator>
		<pubDate>Fri, 18 Dec 2009 07:31:12 +0000</pubDate>
		<guid isPermaLink="false">http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24219</guid>
		<description>@ttr

Das erstellte Blog-Corpus wird auf der verlinkten Seite veröffentlicht, sobald ich die Daten entsprechend verarbeitet habe.

Zur Verarbeitung natürlicher Sprachen hab ich mir sehr viele unterschiedliche Systeme angeschaut und bin leider von fast allen enttäuscht worden. Die meisten Frameworks sind einfach nicht für eine derart große Datenmenge ausgelegt wie was ich eigentlich analysieren will.

Ich  habe  mich deshalb in den letzten Monaten mit dem &lt;a href=&quot;http://incubator.apache.org/uima/&quot; rel=&quot;nofollow&quot;&gt;UIMA Framework&lt;/a&gt; auseinandergesetzt, das hervorragende Leistungen bringen kann. Das System realisiert ein Multi-Agenten-System, das recht einfach parallelisiert werden kann. Entsprechende Implementierungen vorausgesetzt schaffe ich so derzeit die Analyse von 13 Mio. Benutzerbeiträgen innerhalb 2 Tagen. Diese Performanz-Eigenschaften sind bei solchen Datenmengen sehr wichtig und genau hier scheitern die meisten verfügbaren Tools.

Ich hab mir vorgenommen, in den nächsten Tagen einzelne Teile hier im Blog vorzustellen. Dazu gehört eben UIMA, aber auch Lucene. Analyse-Details werden in entsprechenden Veröffentlichungen dann publiziert, für die demnächst eine eigene enstprechende Seite angelegt wird.</description>
		<content:encoded><![CDATA[<p>@ttr</p>
<p>Das erstellte Blog-Corpus wird auf der verlinkten Seite veröffentlicht, sobald ich die Daten entsprechend verarbeitet habe.</p>
<p>Zur Verarbeitung natürlicher Sprachen hab ich mir sehr viele unterschiedliche Systeme angeschaut und bin leider von fast allen enttäuscht worden. Die meisten Frameworks sind einfach nicht für eine derart große Datenmenge ausgelegt wie was ich eigentlich analysieren will.</p>
<p>Ich  habe  mich deshalb in den letzten Monaten mit dem <a href="http://incubator.apache.org/uima/" rel="nofollow">UIMA Framework</a> auseinandergesetzt, das hervorragende Leistungen bringen kann. Das System realisiert ein Multi-Agenten-System, das recht einfach parallelisiert werden kann. Entsprechende Implementierungen vorausgesetzt schaffe ich so derzeit die Analyse von 13 Mio. Benutzerbeiträgen innerhalb 2 Tagen. Diese Performanz-Eigenschaften sind bei solchen Datenmengen sehr wichtig und genau hier scheitern die meisten verfügbaren Tools.</p>
<p>Ich hab mir vorgenommen, in den nächsten Tagen einzelne Teile hier im Blog vorzustellen. Dazu gehört eben UIMA, aber auch Lucene. Analyse-Details werden in entsprechenden Veröffentlichungen dann publiziert, für die demnächst eine eigene enstprechende Seite angelegt wird.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: ttr</title>
		<link>http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24218</link>
		<dc:creator>ttr</dc:creator>
		<pubDate>Thu, 17 Dec 2009 21:25:12 +0000</pubDate>
		<guid isPermaLink="false">http://www.mathias-bank.de/2009/12/17/blog-analysen/#comment-24218</guid>
		<description>Klingt interessant, habe mein Blog gerade eingetragen.
Veröffentlichst du deine Arbeit nach der Fertigstellung hier?
Und was für Software benutzt du dafür? Ich habe vor einer Weile NLTK entdeckt und etwas damit experimentiert.
Hoffentlich habe ich demnächst etwas mehr Zeit um mich in die Thematik einzuarbeiten.</description>
		<content:encoded><![CDATA[<p>Klingt interessant, habe mein Blog gerade eingetragen.<br />
Veröffentlichst du deine Arbeit nach der Fertigstellung hier?<br />
Und was für Software benutzt du dafür? Ich habe vor einer Weile NLTK entdeckt und etwas damit experimentiert.<br />
Hoffentlich habe ich demnächst etwas mehr Zeit um mich in die Thematik einzuarbeiten.</p>
]]></content:encoded>
	</item>
</channel>
</rss>

