Word Frequency Analyse som et middel til å forbedre skrive kvalitet


   nbsp; av: John Tello
I gamle tider av Windows 1.0 tilbake i 1980 er der ble et verktøy kalt Word
Frekvens som fulgte med MS Word distribusjonen pakken. Du som bruker engelsk
som andrespråk jeg brukte det tungt, fordi det hjalp meg å forbedre mitt vokabular
og å rette feilstavelser utover kapasiteten på tilgjengelige stavekontroll.
At MS Word-tillegget laget en liste over alle ordene i et dokument, organisert etter
frekvens. Det gjorde det lett å oppdage overforbruk og / eller misbruk av et bestemt ord eller
uttrykk. Den lille brukte ordene var også til hjelp, fordi jeg noen ganger skriver Thomson
i stedet for Thompson, bil istedet for handlevogn, eller lignende feil som stavekontrollen
oppdager ikke.

Frekvens analyse kan også brukes som et middel til å etablere “signatur” av en
enkelte forfatter, det kulturelle nivået på forfatter, bruken av slang eller teknisk
sjargong, og andre skriver funksjoner. Det er mulig å ekstrapolere antall ord
brukes i en viss tekst til den totale ordforråd på en person. Frekvensanalyse kan
anklage noen forfattere å ha vokabular av en 10 år gammel. Eller ordet-rikdom av
Kinesisk-født 2. år engelsk student.

Frekvens analyse kombinert med et synonym ordbok, som angitt i øyeblikket
tilgjengelig “synonymizer” programvare, kan hjelpe forfattere å berike sine leksikon og unngå
misbruk av enkelte uttrykk.

Det er også et middel for å unngå å produsere identisk tekst for de som trenger å gjøre sin
tekst forskjellig fra en kilde. For eksempel en web-innhold skribent som må fylle
mange lignende men ikke identiske sider, og studenter som ønsker å unngå plagiat
deteksjon og anklage. Rette eller urette.

Plagiat oppdagelsen gjør også bruk av frekvens analyse, fordi sammenligning av en
gitt tekst med hele web-innhold er en stor oppgave, og påvisning systemet
ikke vet hvor du skal lete, og hvor du skal begynne. Dermed kan analysere ordet frekvens gir
noen anelse om skrivestilen og forfatterskap av en gitt tekst, uten indeksering
hele greia.

Søkemotorer bruker ordet frekvens å etablere emnet nettsider. De
utviklet komplekse lingvistiske analyser for å klassifisere sider ved faget uten
menneskelige inngrep. I sin tur webansvarlige gjøre det samme, å prøve å lure søkemotorene
til å tilordne høy søkeordets relevans til sidene de oppretter. For eksempel bruker en
ord med en 3 frekvens gir en tekst god relevans på det ordet (eller søkeord, i en
søkemotor sammenheng). En 10 frekvens fortsatt er OK, men det er nær “søkeord
stuffing “, en teknikk brukt av webmastere som prøver å tvinge sine nettsteder i toppen
steder av søkemotorene. Søkeordeksess blir straffet av søkemotorer, og
må forebygges ved smart bruk av synonymer. Enten med synonymizer programvare eller
gode skriveferdigheter.

Denne artikkelen, for eksempel, har følgende Word Frequency:
ord: 9, frekvens: 7, brukt: 6, ikke: 6, search: 6, tekst: 6, motorer: 6, analyse:
5, kan: 5, bruk: 5 … …

Jeg kunne har redigert teksten etter analysen, for å unngå intensiv bruk av “ord” og
“frekvens” for språklige formål. Men det er OK for søkemotoroptimalisering
formål (prøver å gjøre denne artikkelen mer søkbar via Google og Yahoo).

Er det noen seriøse forfattere som fortsatt unngå bruk av en kablet datamaskin? Sannsynligvis
Ikke mange kan unngå å bruke Internett og søkemotorer for å finne det riktige ordet, i
mest brukte uttrykk, til å utføre stavekontroll eller grammatikkontroll. Sjekke ord bruk i
Google er raskere og mer effektivt enn å bruke en ordbok, enten i papir, plate eller
Web. Søkemotorene listen hvert ord som noensinne er skrevet, ikke bare den velskrevne
ord som ordbøker gjøre.

Vær forberedt på å få tekstene analysert for ord frekvens, utdanningsnivå,
plagiat, teknisk, jargon bruk og andre parametere i tillegg til
gammeldags skrivemåte.

I henhold til disse tendensene, ville den ultimate utfordringen for en jobb kandidaten være å
skrive et essay med papir og penn. De fleste av oss ikke er forberedt til å passere en slik test.

Jeg forventer ikke å se synonymized versjoner av denne artikkelen …

This entry was posted in Fritid and tagged , , , , , , , . Bookmark the permalink.