Komputer ma nam ułatwić życie. Jednym prostym przykładem jest usunięcie wierszy z pliku tekstowego, który nie zawiera określonego słowa kluczowego. To zadanie nie jest trudne, ale bardzo czasochłonne i nużące. Ostatnio spędziłem trochę czasu na tworzeniu listy stron internetowych, które skopiowały i opublikowały artykuły pobrane z tego bloga na ich stronę. Chociaż Google ma całkiem dobrą robotę w ustalaniu oryginalnego wydawcy, wciąż jest robotem opartym na grupie ciągle zmieniających się algorytmów, które mogą popełniać błędy. Wyszukiwanie stron internetowych, z których skopiowano posty, jest bardzo czasochłonne, więc użyłem Copyscape Premium, aby automatycznie wykonać skanowanie wsadowe wszystkich 2000 artykułów na tej stronie, aby wyśledzić plagiat treści z tego bloga.
Copyscape Premium zakończył skanowanie wszystkich 2000 postów w zaledwie 10 godzin i mogłem wyeksportować wyniki do pliku CSV w celu dalszego zbadania. Na liście znajduje się ponad 20 000 adresów URL i chcę kategoryzować witryny na podstawie nazw domen. Nie wszystkie strony z listy są naśladowcami, ale większość stron hostowanych na darmowych hostach, takich jak blogspot / blogger / wordpress, jest albo skrobakami, albo narzędziem do kopiowania. Po skategoryzowaniu adresów URL mogę skoncentrować się na złożeniu skargi do DMCA na Bloggerze, a następnie na WordPressie zamiast przeskakiwania tam i z powrotem. Użytkownicy Linuksa mogą łatwo usuwać wiersze, które nie zawierają określonych słów, używając globalnej komendy ex, ale niestety potrzebujemy oprogramowania, aby to zrobić w systemie Windows. Ponieważ jestem użytkownikiem Notepad ++, odkryłem, że możliwe jest automatyczne usuwanie wierszy za pomocą Notepad ++, gdy określone przez ciebie słowo nie jest obecne. Oto przykład, w jaki sposób usunąć wiersze, które nie zawierają słowa „blogspot.com”, lub innymi słowy, chcę tylko zachować wiersze zawierające słowo „blogspot”.
1. Uruchom Notepad ++, albo otwórz plik tekstowy, który chcesz edytować, albo wklej tekst do pustej strony.
2. Przejdź do paska menu Wyszukaj i wybierz Znajdź
3. Przejdź do zakładki Oznacz, zaznacz pole wyboru Linia zakładek, wpisz blogspot.com w polu znajdź, a następnie kliknij przycisk Zaznacz wszystko. Niebieska ikona zostanie dodana do wiersza zawierającego słowo blogspot.com
4. Zamknij okno Oznacz.
5. Przejdź do paska menu Szukaj> Zakładka> i wybierz Usuń nieoznaczone linie
Jeśli edytowany plik tekstowy jest bardzo duży, proces ten może chwilę potrwać. Możesz także wybrać opcję Usuń linie zakładek z wyszukiwania> Zakładka, jeśli próbujesz usunąć linie zawierające określone słowa. Zapoznaj się z osadzonym filmem poniżej, jeśli masz problemy z postępowaniem zgodnie z instrukcjami krok po kroku dotyczącymi usuwania wierszy bez słów kluczowych za pomocą Notepad ++.