Forum:Mögliche neue Kategorisierung von Plagiaten

Forum: Übersicht > Mögliche neue Kategorisierung von Plagiaten

Im Forum ist kein Raum für persönliche Angriffe: VP:KPA. Alle Beiträge im Forum sind Meinungsäußerungen der jeweils Beitragenden und deshalb zu signieren (vier Tilden an das Ende des Beitrags setzen: ~~~~). Weitere Tipps zum Forum finden sich unter VP:Forum, Hinweise zur Moderation unter VP:Moderation.

Ich glaube, es gibt wenige Aktive bei Vroniplag, die die gegenwärtige Plagiatskategorisierung als ideal empfinden. Für mich ist sie eher eine praktikable, und relativ einfache Lösung. Insgesamt sehe ich 3 Probleme:

a) Die Kategorie "verdächtig" ist unglücklich gewählt, da sie in den meisten Fällen eben nicht für einen Plagiatsverdacht verwendet wird, dem man noch nachgehen muss um ihn entweder auszuräumen, oder zu bestätigen. In den meisten Fällen werden grenzwertige Fragmente als "verdächtig" bezeichnet, für die man den umfassenden, für sich alleine stehenden Plagiatsvorwurf nicht artikulieren will.

b) Die meisten Plagiatskategorien beinhalten in der Namensgebenung den Plagiatsvorwurf (e.g. Komplettplagiat, Übersetzungsplagiat, etc ...), das ist nicht immer glücklich, da -- je nach Sprachgebrauch -- eine Täuschungsabsicht impliziert wird, und diese anhand eines Fragments meist nicht nachzuweisen ist.

c) Die gegenwärtig verwendeten Plagiatskategorien überlappen sich häufig, was zu inkonsistenten Klassifizierungen führt.

Als Diskussionsgrundlage bzw. Denkanstoß würde ich gerne folgende mögliche neue Klassifizierung vorstellen für zukünftige Fälle:

A) Das Dreigestirn: "Kein Plagiat", "Verdächtig", "Plagiat" (i.e. eine der Plagiatskategorien) wird durch vier Bewertungen ersetzt: "unfertig", "nicht zu beanstanden", "grenzwertig", "zu beanstanden". Dabei gehen nur Fragmente die als "zu beanstanden" klassifiziert sind in den Barcode ein.

B) Die gegenwärtigen Plagiatskategorien werden (zumindest für die Bewertung von Fragmenten) abgeschafft. Um die Fragmente jedoch in Kurzform zu charakterisieren, werden verschiedene Dimensionen eingeführt. Ích schlage die folgenden Dimensionen vor:

Die Quelle wird im Zusammenhang mit der beanstandeten Textstelle genannt? Mögliche Attribute
1. Nein
2. Ja
3. Ja, aber eine Übernahme wird ausgeschlossen, z.B. durch distanzierende Einleitungen des Quellenverweises wie: "vgl", "siehe auch", "ebenso auch", etc.
Nähe zum Text der Quelle: Mögliche Attribute:
1. Wortwörtliche Übernahme
2. Wörtliche Übernahme mit Anpassungen -- alle wesentlichen Formulierungen stammen aus der Quelle
3. Sinngemäße Übernahme mit Übernahme einiger Formulierungen
4. Sinngemäße Übernahme
Sprache der Quelle: Mögliche Attribute:
1. Identisch zur untersuchten Arbeit
2. Nicht identisch zur untersuchten Arbeit
Mögliche weitere Dimensionen (die mir jedoch als weniger wichtig erscheinen) sind die Folgenden:
1. Übernahme geht nach dem Quellenverweis weiter ( möglicherweise als Attrribut 1.4. -- dann bräuchte man allerdings auch noch Attribut 1.5, welches "1.3 und 1.4" bedeuten würde. Alternativ könnte auch Attribut 1.3. als separate Tickbox implementiert werden).
2. Länge der Übernahme (in Zeilen) -- insbesondere wenn man die Dimensionen verwenden will, um die Schwere der Übernahme automatisiert zu charakterisieren (fraglich ob das Sinn macht)
3. Fragment beinhaltet Übernahme von Literaturverweisen
4. Fragment beinhaltet Übernahme von Fehlern aus der Quelle
5. ???

Ich kann nicht voll überblicken, wie solche Dimensionen am besten implementiert werden können, aber ich könnte mir vorstellen, dass im Zuge der Umstellung auf SMW hier einfache Möglichkeiten existieren?

Insgesamt glaube ich, dass so eine Umstellung die oben genannten Probleme weitgehend lösen würde, ohne dass der Workflow grundlegend umgestellt werden müsste. Das einzige Problem sehe ich in einer möglicherweise zusätzlichen Komplexität. Allerdings hängt diese von der Art der Implementierung ab -- und für neue User könnte es einfacher sein, 3 konkrete Dimensionen zu bewerten, als sich überlappende, nicht klar definierte Plagiatskategorien zuzuordnen.

Was haltet ihr davon? Was könnte man an dem Vorschlag noch verbessern? Wie könnte man den Vorschlag am besten implementieren? Am besten bitte Kommentare nur unter dem Vorschlag, um die Lesbarkeit zu erhalten. Hindemith 12:10, 12. Mär. 2012 (UTC)

Finde ich insgesamt eine gute Idee. Zu A): „grenzwertig“ würde ich vielleicht ersetzen, z.B. durch „unklar“. Sonst gibt es ein Problem, wenn die Textübereinstimmung zwar unstrittig ist (also nicht „grenzwertig“) trotzdem aber keine Klärung z.B. von Datum oder Autor möglich ist (das Fragment wäre dann für immer „unfertig“). Zu B): Das Wort "Übernahme" ist weniger anklagend als "Plagiat", impliziert vielleicht keine Täuschungsabsicht mehr, aber immer noch ein bewusstes Vorgehen. Ebenso "mit Anpassungen". Vielleicht gibt es noch wertungsfreiere Altternativen. Z.B. "Übereinstimmung" statt "Übernahme", "mit Abweichungen" statt "mit Anpassungen" bzw. 2.2: "Weitgehend wörtliche Übereinstimmung" statt "Wörtliche Übernahme mit Anpassungen". Oder man verzichtet ganz auf "Übernahme" bzw. "Übereinstimmung". Reichen nicht auch einfach Adjektive? ("wortwörtlich", "weitgehend wörtlich", "sinngemäß", "weitgehend sinngemäß"). - Hood 13:23, 12. Mär. 2012 (UTC). Nachtrag: Vielleicht noch besser: "teilweise" oder "teils" statt "weitgehend" (ist kürzer und passt noch besser).- Hood 13:34, 12. Mär. 2012 (UTC)

Ja, ich glaube, die genaue Wortwahl kann noch optimiert werden -- Danke für die Vorschläge. Hindemith 20:44, 17. Mär. 2012 (UTC)

Finde den Vorschlag sehr gut, und sollte mit SMW recht einfach zu implementieren sein. Praezision und Erfassbarkeit sehe ich als klar besser an. Ich denke auch, dass das Beantworten konkreter Fragen einfacher und genauer ist als die Kategorien. Als einziges Manko seh ich, dass die plakative/bildliche Wirkung der Kategorien verloren geht, was manche Menschen ja auch besonders anspricht. Vielleicht kann man das irgendwie kompensieren, aber mir faellt dazu gerade nichts Vernuenftiges ein. Sicher kann man aus den erhobenen Daten wieder die alten Kategorien gewinnen. Altbestand sollte wohl so bleiben, wie er ist, und man muesste das neue System mal bei einem Fall von Anfang an durchexerzieren um Erfahrungen zu sammeln. Zeilen muss man nicht zaehlen, das kann software automatisiert machen wenn noetig. Marcusb 21:45, 12. Mär. 2012 (UTC)

Ich sehe ein Problem mit der ersten Kategorie. Was ist z.B., wenn ein nach bisheriger Kategorisierung einseites Bauernopfer daherkommt. Wird dann die Quelle im Zusammenhang mit der Uebernahme genannt? Am Seitenende wohl schon, aber am Seitenbeginn moechte man dann doch nicht von Quellenangabe sprechen. Das wuerde dem ganzen eine falsche Faerbung verpassen, denke ich. Ansonsten finde ich das Ueberdenken der mir schon immer recht befremdlichen Plagiatskategorien eine sehr gute Idee und halte auch Hindemiths Ansatz fuer sehr gelungen. Fiesh 01:49, 13. Mär. 2012 (UTC)

Ich glaube, das gäbe kein Problem. Man klassifiziert so ein einseitiges Fragment einfach als "Quelle im Zusammenhang genannt", setzt es aber auf "zu beanstanden". Es gibt dann noch die Anmerkungen um zu präzisieren. Hindemith 20:44, 17. Mär. 2012 (UTC)

Mir gefällt der Vorschlag insgesamt gut. Die Grenzfälle bleiben vermutlich auch weiterhin Grenzfälle. Wenn die bisherigen Kategorien sich nicht 1:1 übersetzen lassen, geht leider etwas die Vergleichbarkeit verloren. Je mehr Masse auf VroniPlag erarbeitet wird, desto repräsentativer werden die Aussagen dazu, wie einzelne Fragmente sich auf die verschiedenen Kategorien verteilen, und damit auch dazu, wie häufig und wie seltener plagiiert wird. Insgesamt aber ein Gewinn. PlagProf:-) 19:35, 19. Mär. 2012 (UTC)

Ich moechte gerne die Diskussion wieder aufgreifen. Ich weiss nicht, ob wir das in einer Sitzung besprechen sollten oder einfach im Forum klaeren und umsetzen. Ich hatte damals vor Bds den neuen Workflow einfach etabliert, und er wurde dann im "laufenden Betrieb" ueberarbeitet. Das scheint mir besser, als hypothetisch ueber Aenderungen abzustimmen und dann womoeglich zu merken, dass was uebersehen wurde. Ich moechte eine leichte Modifikation von Hindemiths Dimensionen Vorschlagen:

a) Wir sollten weiter Gepruef/Ungeprueft haben. Denn sonst scheint es mir nicht moeglich, dass der Ersteller einen "Guetevorschlag" (nicht zu beanstanden, grenzwertig, zu beanstanden) macht. Die Guete bleibt in dreistufig.

b) Quellennennung bleibt dreistufig mit Werten "ja, distanziert, nein"

c) Naehe hat hat drei Werte: "woertlich (mit moeglicherweise kleinaenderungen wie dem einfuegen von artikeln etc., die wir nicht getrennt aufschluesseln sollten, finde ich), woertlich mit signifikanten Aenderungen (etwa inhaltlicher Natur, z.b. Jahreszahlen oder Namen geaendert, oder auch abaenderung durch relevante Worteinfuegungen), sinngemaess (signifikate Umstellungen etc.)

d) Sprache ist kein ja/nein Attribut sondern kann als zusaetzliches Flag mit "Aus fremdsprachlicher Quelle uebersetzt" gesetzt werden. Es taucht selten auf und wird dann bestimmt nicht uebersehen, so dass man nicht bei jeder Fragment gezwungen sein sollte, diesen Wert zu setzen.

e) Keine weiteren zwingenden Attribute, man kann gerne zusaetzliche Merkmale wie auch die Sprachaenderung separat als Kategorie oder so setzen, aber die eigentliche Kategorisierung erfolgt nur nach Geprueft/Ungeprueft, nicht zu beanstanden/grenzwertig/zu beanstanden, ja/distanziert/nein, woertlich/abgeaendert/sinngemaess.

Ich halt dieses System fuer etwas besser da zusaetzlich einfacher. Zu viele Abstufungen bewirken womoeglich nur, dass unterschiedliche Mitwirkende unterschiedlich werten, und diese Abstufung scheint mir ausreichend, da alles Interessante erfasst wird. Was meint ihr? Fiesh 19:00, 6. Apr. 2012 (UTC)

Hier mein Kommentar:

a) Ja, das macht sehr viel Sinn ... moeglicherweise koennte man geprueft/ungeprueft noch um "unfertig" erweitern, ist aber nicht zwingend.

b) finde ich gut ... ich koennte mir hoechstens noch vorstellen, die info: "Uebernahme geht nach der Quellennennung weiter" einzufuehren. Man koennte das in drei Tickboxes implementieren: 1. Quelle genannt (ja/nein), 2. Quellennennung ist distanzierend (ja/nein) 3. Uebernahme geht nach dem Quellenverweis weiter (ja/nein). Speziell 3 ist nicht ganz unwichtig, da dann ja die Quelle nur fuer einen Teil des Fragments genannt ist, nicht aber den anderen.

c) - e) finde ich gut

Moeglicherweise koennte man die 5 "Hauptplagkategorieen" direkt automatisch generieren, dann waere auch die Vergleichbarkeit gewaehrleistet ... Hindemith 21:04, 6. Apr. 2012 (UTC)

Was mir gerade noch einfällt. Bei zahlreichen dokumentierten Übernahmen mit Seitenumbrüchen wird in den Anmerkungen auf die Seitenfortsetzung hingewiesen: Z.B. Fortgesetzt von voriger Seite, Fortsetzung in nachfolgender Seite...

Deratige Anmerkungen sind nicht unwichtig, da sonst z.B. nicht klar ist, dass kurze Fagmente Teil eines größeren zusammenhängenden Texts sind. Vielleicht hat jemand eine Idee, ob oder wie man hierzu eine Angabe in der Vorlage standardmäßig vorsehen könnte, ohne dass Einstufungen (Dimensionen, Flags) insgesamt zu überladen sind.- Hood 21:25, 6. Apr. 2012 (UTC)

Zu Hindemiths Anmerkung: "unfertig" ist eine gute Idee, sollte man einfach hinzunehmen, koennte sich als nuetzlich erweisen.

Bei der "nach Quellennennung weiter" Sache bin ich mir etwas unschluessig. Ist es wirklich schlimmer, wenn nach der Fussnote noch weiter uebernommen wird, als wenn etwa im Absatz vor dem Absatz, der mit Fussnote versehen ist, uebernommen wurde? Ich halte das ehrlich gesagt fuer Details, die nicht in der grundlegenden Kategorisierung beruecksichtigt werden sollten. Wichtig ist doch, dass die Quellennennung die Uebernahme nicht ausreichend abdeckt. Ob sie nun zu frueh oder zu spaet erfolgt, ist doch eigentlich unwichtig.

Das Erstellen der Hauptkategorien halte ich auch fuer eine gute Idee, man kann dann einfach ein Konzept machen, das alle Fragmente mit bestimmten Werten auflistet, wie wir das ja schon vielfach haben.

Zu Hoods Anmerkung: Ich denke, als Anmerkung genuegt. Aber das bringt mich auf etwas, das ist schon immer schlecht fand: Die rein syntaktische Trennung eines Fragments, wenn es sich ueber einen Seitenumbruch erstreckt. Finde ich eigentlich aeusserst unklug. Wenn etwa wie bei Vs ein ganzes Kapitel kopiert wurde, dann ist das doch ein Fragment, die Semantik entscheidet, nicht die Syntax. Daher schlage ich vor, dass ein Fragment nur nach semantischen (wir nutzen ja jetzt SMW ;)) Gesichtspunkten erstellt werden sollte und sich insbesondere ueber mehrere Seiten erstrecken koennen sollte. Man gibt dann eben bei der Zeilenangabe die Anfangszeile auf der Anfangsseite und die Endzeile auf der Endseite an. Ganz pragmatisch spart das auch Arbeit und verhindert Einzeiler-Fragmente, die manchmal schon von Aussenstehenden als laecherlich abgetan wurden, weil sie nicht sahen, dass diese Fragmente nur Teil eines Grossen waren. Was meint ihr? Fiesh 23:55, 6. Apr. 2012 (UTC)

Noch als weitere Anmerkung: Das bedeutet natuerlich auch, dass ein Fragment durchaus mal ueber mehrere Absaetze gehen kann, wo zwischendurch eigenstaendiger Text des Autors kommt. Ich denke, wir sollten lediglich als Regel festhalten, dass kein Fragment innerhalb eines anderen sein darf, dass also die Fragmente linear geordnet sein muessen. Fiesh 23:59, 6. Apr. 2012 (UTC)

Ich stimme Fiesh in alllen Punkten zu. - Hood 09:01, 7. Apr. 2012 (UTC)

Wenn plagiierter Text durch Passagen von nicht-plagiiertem Text unterbrochen wird, könnte das evtl. etwas unübersichtlich werden. Konsequenter fände ich es dann, wenn man pro Quelle ein einziges Fragment anlegt. Hotznplotz 09:26, 7. Apr. 2012 (UTC)

Hm. Das erinnert mich an Vorschläge von Plaqueiator bzgl. einer quellenorientierten Darstellung, die ihre Vorteile hat, wenn sehr viele kurze Fragmente aus einer einzigen Quelle stammen, die jedes für sich aber nicht so gravierend sind, insgesamt aber einen eindeutigen Eindruck vermitteln. Für den Work-Flow wäre es wohl schon besser, wenn alles in kleinen einzelnen zu bearbeitenden Häppchen bleibt. Ist also eher ein Problem der Darstellung für den Leser, wie diese Häppchen zusammengefügt und als Ganzes sichtbar gemacht werden. - Hood 09:38, 7. Apr. 2012 (UTC)

Nachtrag: Wie wäre es mit dem Kompromiss, dass für zusammenhängenden plagiierten Text nur ein einziges Fragment angelegt wird, bei Unterbrechungen mit nicht-plagiiertem aber wie gehabt mehrere Fragmente angelegt werden? In der Darstellung für den Leser könnte man sich darauf einigen, dass die Textnachweise nur noch nach Quellen sortiert angezeigt werden. Vielleicht ließe sich ja auch etwas Tolles programmieren, dass je alle Fragmente aus einer einzigen Quellen später automatisch zusammengefügt werden können. Hier sind die Experten gefragt. - Hood 09:59, 7. Apr. 2012 (UTC)

Man kann Abfragen machen und dann dementsprechend die Kategorien oder was anderes setzen, ist aber nicht ganz trivial, da man evtl mit geschachtelten Parserfunktionen arbeiten muss. Technisch ist es jedenfalls möglich. -- Sotho Tal Ker 08:02, 7. Apr. 2012 (UTC)