<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Reacties op: LSI &#8211; Het gebruik van semantiek in zoekmachines</title>
	<atom:link href="http://netters.nl/lsi-semantiek/feed/" rel="self" type="application/rss+xml" />
	<link>http://netters.nl/lsi-semantiek/#utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=lsi-semantiek</link>
	<description></description>
	<lastBuildDate>Mon, 06 Feb 2012 11:32:42 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
	<item>
		<title>Door: turnon</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6044</link>
		<dc:creator>turnon</dc:creator>
		<pubDate>Thu, 04 Sep 2008 23:37:06 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6044</guid>
		<description>Kent iemand schrijvers die bekend zijn met het LSI principe ?

</description>
		<content:encoded><![CDATA[<p>Kent iemand schrijvers die bekend zijn met het LSI principe ?</p>
]]></content:encoded>
	</item>
	<item>
		<title>Door: SimmeV8</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6038</link>
		<dc:creator>SimmeV8</dc:creator>
		<pubDate>Wed, 03 Sep 2008 07:27:28 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6038</guid>
		<description>http://www.google.nl/search?hl=nl&amp;rlz=1B3GGGL_nlNL266NL266&amp;q=Bedrijfsfeest+Amsterdam&amp;btnG=Zoeken&amp;meta=

dit zeg dat wel weer genoeg he!%^*$%</description>
		<content:encoded><![CDATA[<p><a href="http://www.google.nl/search?hl=nl&#038;rlz=1B3GGGL_nlNL266NL266&#038;q=Bedrijfsfeest+Amsterdam&#038;btnG=Zoeken&#038;meta" rel="nofollow">http://www.google.nl/search?hl=nl&#038;rlz=1B3GGGL_nlNL266NL266&#038;q=Bedrijfsfeest+Amsterdam&#038;btnG=Zoeken&#038;meta</a>=</p>
<p>dit zeg dat wel weer genoeg he!%^*$%</p>
]]></content:encoded>
	</item>
	<item>
		<title>Door: Navin</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6031</link>
		<dc:creator>Navin</dc:creator>
		<pubDate>Tue, 02 Sep 2008 03:05:48 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6031</guid>
		<description>Ter additie aan dit mooie discussie wil ik graag toevoegen de onderstaande linkjes:

&lt;a href=&quot;http://irthoughts.wordpress.com/2008/08/14/ir-and-seo-misnomers/&quot;&gt;IR and SEO misnomers&lt;/a&gt;
&lt;a href=&quot;http://irthoughts.wordpress.com/2007/05/01/irwatch-may-issue-demystifying-lsi/&quot;&gt;IRWatch May Issue: Demystifying LSI&lt;/a&gt;
&lt;a href=&quot;http://www.seomoz.org/blog/the-search-engines-semantic-analysis-capabilities&quot;&gt;The Search Engines&#039; Semantic Analysis Capabilities&lt;/a&gt;

En zeker ook:
&lt;a href=&quot;http://dpn.name/2007/06/04/seos-caught-out/&quot;&gt;SEO?s caught out&lt;/a&gt;

Dit is denk ik een avondje genoeg leesvoer voor de hongerige SEO ogen.</description>
		<content:encoded><![CDATA[<p>Ter additie aan dit mooie discussie wil ik graag toevoegen de onderstaande linkjes:</p>
<p><a href="http://irthoughts.wordpress.com/2008/08/14/ir-and-seo-misnomers/">IR and SEO misnomers</a><br />
<a href="http://irthoughts.wordpress.com/2007/05/01/irwatch-may-issue-demystifying-lsi/">IRWatch May Issue: Demystifying LSI</a><br />
<a href="http://www.seomoz.org/blog/the-search-engines-semantic-analysis-capabilities">The Search Engines&#8217; Semantic Analysis Capabilities</a></p>
<p>En zeker ook:<br />
<a href="http://dpn.name/2007/06/04/seos-caught-out/">SEO?s caught out</a></p>
<p>Dit is denk ik een avondje genoeg leesvoer voor de hongerige SEO ogen.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Door: MacSeth</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6028</link>
		<dc:creator>MacSeth</dc:creator>
		<pubDate>Mon, 01 Sep 2008 07:20:00 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6028</guid>
		<description>Tovallig kom ik net deze &lt;a href=&quot;http://www.mydigitallife.info/2007/05/25/futuristic-rotating-tower-skyscraper-in-dubai/nl/&quot; target=&quot;_blank&quot; title=&quot;PDF - Nieuw venster&quot;&gt;crap-website&lt;/a&gt; website tegen waarin het artikel ansich echt geen nuttige content heeft.
Ik vermoed overigens dat dit van origine een engels artikel is geweest en dat deze 1 op 1 vanuit een translate programma is gepost maar het laat wel zien dat nutteloze teksten gewoon worden gevonden :S</description>
		<content:encoded><![CDATA[<p>Tovallig kom ik net deze <a href="http://www.mydigitallife.info/2007/05/25/futuristic-rotating-tower-skyscraper-in-dubai/nl/" target="_blank" title="PDF - Nieuw venster">crap-website</a> website tegen waarin het artikel ansich echt geen nuttige content heeft.<br />
Ik vermoed overigens dat dit van origine een engels artikel is geweest en dat deze 1 op 1 vanuit een translate programma is gepost maar het laat wel zien dat nutteloze teksten gewoon worden gevonden :S</p>
]]></content:encoded>
	</item>
	<item>
		<title>Door: Eduard Blacquière</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6022</link>
		<dc:creator>Eduard Blacquière</dc:creator>
		<pubDate>Thu, 28 Aug 2008 19:09:13 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6022</guid>
		<description>Goed artikel, Erik-Jan, complimenten! 

@Ulco
Thanks voor de documentatie, ik ga me er eens in verdiepen.</description>
		<content:encoded><![CDATA[<p>Goed artikel, Erik-Jan, complimenten! </p>
<p>@Ulco<br />
Thanks voor de documentatie, ik ga me er eens in verdiepen.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Door: Erik-Jan</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6018</link>
		<dc:creator>Erik-Jan</dc:creator>
		<pubDate>Tue, 26 Aug 2008 15:48:42 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6018</guid>
		<description>@Seth: Ik stel niet dat LSI de enige techniek is waarop Google content beoordeeld. Spammy teksten (lees in dit verband: slechte grammatica) zullen door Google weggefilterd worden als ze dat algoritmisch gezien goed lukt.

@Ulco: Ik ben het met je eens dat LSI op de hele dataset enorm moeilijk is, maar op subsets kan het prima. Ik heb het in werking gezien en stond werkelijk perplex van de resultaten. Helaas kan ik daar niet meer over vertellen (althans, niet via dit medium...).</description>
		<content:encoded><![CDATA[<p>@Seth: Ik stel niet dat LSI de enige techniek is waarop Google content beoordeeld. Spammy teksten (lees in dit verband: slechte grammatica) zullen door Google weggefilterd worden als ze dat algoritmisch gezien goed lukt.</p>
<p>@Ulco: Ik ben het met je eens dat LSI op de hele dataset enorm moeilijk is, maar op subsets kan het prima. Ik heb het in werking gezien en stond werkelijk perplex van de resultaten. Helaas kan ik daar niet meer over vertellen (althans, niet via dit medium&#8230;).</p>
]]></content:encoded>
	</item>
	<item>
		<title>Door: Ulco</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6017</link>
		<dc:creator>Ulco</dc:creator>
		<pubDate>Tue, 26 Aug 2008 15:12:00 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6017</guid>
		<description>Dat LSI hoor ik één keer in de zoveel tijd steeds weer terugkomen maar ik ben er eigenlijk helemaal niet mee eens...

Om een dergelijke semantische index voor het hele web aan te leggen is m.i. bijna onmogelijk. Laat staan om er dan nog eens berekeningen mee uit te gaan voeren. Het lijkt me/is veel meer een techniek om beperkte databases mee te analyseren of eventueel binnen een site clusters te kunnen ontdekken (daar waar woorden niet exact overeenkomen).

Vergelijkbaar, maar toch net anders is de &lt;em&gt;Google Proximity Index&lt;/em&gt; of de &lt;em&gt;Google Similarity Distance&lt;/em&gt;. Qua berekening zijn die veel compacter - en eigenlijk ook wel logischer.

Mooie documentatie over de &lt;a href=&quot;http://arxiv.org/PS_cache/cs/pdf/0412/0412098v3.pdf&quot; target=&quot;_blank&quot; title=&quot;PDF - Nieuw venster&quot;&gt;Similarity Distance&lt;/a&gt; (van het CWI, moet gezegd worden). Check ook even appendix 7 waarin kort staat uit uitgelegd dat LSI op webschaal (zoals Google werkt) eigenlijk niet bruikbaar is.

Verder nog iets moois over het &lt;a href=&quot;http://www-alg.ist.hokudai.ac.jp/~thomas/publications/dag_c2c_pz.pdf&quot; target=&quot;_blank&quot; title=&quot;PDF - Nieuw venster&quot;&gt;clusteren van de Google Distance&lt;/a&gt;. Hiermee kom je alweer wat meer op dezelfde logica als die achter LSI maar op een hele andere werkwijze.</description>
		<content:encoded><![CDATA[<p>Dat LSI hoor ik één keer in de zoveel tijd steeds weer terugkomen maar ik ben er eigenlijk helemaal niet mee eens&#8230;</p>
<p>Om een dergelijke semantische index voor het hele web aan te leggen is m.i. bijna onmogelijk. Laat staan om er dan nog eens berekeningen mee uit te gaan voeren. Het lijkt me/is veel meer een techniek om beperkte databases mee te analyseren of eventueel binnen een site clusters te kunnen ontdekken (daar waar woorden niet exact overeenkomen).</p>
<p>Vergelijkbaar, maar toch net anders is de <em>Google Proximity Index</em> of de <em>Google Similarity Distance</em>. Qua berekening zijn die veel compacter &#8211; en eigenlijk ook wel logischer.</p>
<p>Mooie documentatie over de <a href="http://arxiv.org/PS_cache/cs/pdf/0412/0412098v3.pdf" target="_blank" title="PDF - Nieuw venster">Similarity Distance</a> (van het CWI, moet gezegd worden). Check ook even appendix 7 waarin kort staat uit uitgelegd dat LSI op webschaal (zoals Google werkt) eigenlijk niet bruikbaar is.</p>
<p>Verder nog iets moois over het <a href="http://www-alg.ist.hokudai.ac.jp/~thomas/publications/dag_c2c_pz.pdf" target="_blank" title="PDF - Nieuw venster">clusteren van de Google Distance</a>. Hiermee kom je alweer wat meer op dezelfde logica als die achter LSI maar op een hele andere werkwijze.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Door: brewgin</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6016</link>
		<dc:creator>brewgin</dc:creator>
		<pubDate>Tue, 26 Aug 2008 14:26:43 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6016</guid>
		<description>Mooi uitgebreid artikel en een helder verhaal. 

Mijn persoonlijke insteek voor de toekomst is eveneens content, content, content, zonder truken. Je moet wel wat meer geduld hebben, maar daarna zie je vanzelf wel resultaat. 

Helaas als je dit verhaal tegen de huidige praktijk aanhoudt, leg je het nog te vaak af tegen een hoop spam en link buyers.

Maar goed, vandaar ook de toekomstinsteek in het verhaal. </description>
		<content:encoded><![CDATA[<p>Mooi uitgebreid artikel en een helder verhaal. </p>
<p>Mijn persoonlijke insteek voor de toekomst is eveneens content, content, content, zonder truken. Je moet wel wat meer geduld hebben, maar daarna zie je vanzelf wel resultaat. </p>
<p>Helaas als je dit verhaal tegen de huidige praktijk aanhoudt, leg je het nog te vaak af tegen een hoop spam en link buyers.</p>
<p>Maar goed, vandaar ook de toekomstinsteek in het verhaal.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Door: MacSeth</title>
		<link>http://netters.nl/lsi-semantiek/#comment-6015</link>
		<dc:creator>MacSeth</dc:creator>
		<pubDate>Tue, 26 Aug 2008 11:47:00 +0000</pubDate>
		<guid isPermaLink="false">http://www.ejbulthuis.nl/?p=1124#comment-6015</guid>
		<description>In essentie zou je dan een pagina weer heel makkelijk kunnen spammen door allerlei gerelateerde woorden bij elkaar of in elkaars omgeving te zetten bv:

De Ferrari Enzo Italiaanse sportauto 2002 mooi geen trekhaak. (ik zet er even een paar lidwoorden en wat algemenere woorden in om het een beetje echt te laten lijken).

De zoekmachines moeten dus ook nog eens uitzoeken of grammaticaal het zaakje klopt (of in ieder geval voor een groot deel). 

Ik denk zelf dat alleen bij samenwerking tussen mens en algoritme de searches geperfectioneerd kunnen worden.</description>
		<content:encoded><![CDATA[<p>In essentie zou je dan een pagina weer heel makkelijk kunnen spammen door allerlei gerelateerde woorden bij elkaar of in elkaars omgeving te zetten bv:</p>
<p>De Ferrari Enzo Italiaanse sportauto 2002 mooi geen trekhaak. (ik zet er even een paar lidwoorden en wat algemenere woorden in om het een beetje echt te laten lijken).</p>
<p>De zoekmachines moeten dus ook nog eens uitzoeken of grammaticaal het zaakje klopt (of in ieder geval voor een groot deel). </p>
<p>Ik denk zelf dat alleen bij samenwerking tussen mens en algoritme de searches geperfectioneerd kunnen worden.</p>
]]></content:encoded>
	</item>
</channel>
</rss>

