Havok napisał(a):
meterrr napisał(a):
za taka cene wolal bym cybook odyssey, mysle ze duzo fajniejszy niz kindle
Przy ekraniku 6 cali to jeden ch*** co się kupi. Plus starego kindla to klawiatura i przyciski do przewijania. Dotykowe ekraniki są może i są bardziej pro ale trzeba lubić je czyścić.
Ps. Nikt nie potrafi odpowiedzieć na moje zapytanie w temacie calibre?
istotne jest chociaz to jakie formaty mozne czytac
a odnosnie konwersji to mozna napisac ze tutaj jest ladnie opisane ->
clicky
a maly tutorial wyglada tak
- otwieramy calibre, zaznaczamy ksiazke jaka chcemy zmienic, convert individualy
- z lewej strony klikamy debug, wklepujemy jakis folder gdzie calibre bedzie moglo wrzucic pliki tymczasowe
generalnie calibre dziala tak
jakis format np pdf -> xhtml -> inny format np epub
- w zakladce PDF input mamy tylko jedna opcje wartosc od 0-1 , mowi o tym jak calibre wyszukuje paragrafy z pdf'a, im mniejsza wartosc tym coraz wieksze odstepy miedzy liniami beda ignorowane -> wieksze paragrafy
- w zakladce structure detection usuwamy Xpathy
- klikamy ok
przechodzimy do folderu ktory zdefiniowalismy wczesniej
- otwieramy katalog parsed
- otwieramy plik index.html - zawiera cala tresc naszego ebooka - wycinek wyglada mniej wiecej tak
Kod:
<p>database when the cursor is </p>
<p>opened. Thereafter, static cursors operate on the snapshot in the database. </p>
<p/>
<p>C H A P T E R 1 4 </p>
<p>C U R S O R C O S T A N A L Y S I S</p>
<p><b>421</b></p>
<p>support all scrolling options: </p>
<p>, </p>
<p>, </p>
<p/>
<p>, </p>
analizujemy dokument i wpisujemy odpowiedniego xpatha w zakladce Structure detection
w tym wypadku
Kod:
//h:p[re:test(., "C H A P T E R \d+?", "i")]
dzieki temu calibre zacznie kazdy tag <p> ktory ma w sobie napis CHAPTER \d\d od nowej strony
\d - cyfra
klikamy jeszcze raz ok, calibre przerabia znowu pdf'a i cieszymy sie nowym epubem z podzialm na strony
ofc poprawne przerobienie ksiazki nie jest takie proste, np wiekszosc pdf'ow tak jak ten ma wpisany chapter i nr strony na kazdej stronie , w stopce i naglowku
wiec wynikiem bedzie to ze bedziemy mieli podzial na strony jak w pdf'ie co jest bardzo nie pozadane
teraz albo jebiemy sie z XPathem tak zeby zaznaczyc tylko te lementy ktore nie maja przed/po sobie numeru strony
ale to tez nie rozwiazuje problemu bo nawet jesli odpowiednio rozpoznamy rozdzialy to tekst z naglowkow i stopek i tak dalej powedruje do epuba
no wiec trzeba sie teraz pobawic z regexem, ale to juz inna czesc opowiesci